データインポートの命名規則

データは、CSV、Parquet、 Aurora Snapshot、SQL のファイル形式でTiDB Cloudにインポートできます。データが正常にインポートされていることを確認するには、次の 2 種類のファイルを準備する必要があります。

  • スキーマ ファイル。データベース スキーマ ファイル (オプション) とテーブル スキーマ ファイルを両方とも SQL 形式で準備します ( .sql )。テーブル スキーマ ファイルが提供されていない場合は、事前にターゲット データベースに対応するテーブルを手動で作成する必要があります。
  • データファイル。データをインポートするための命名規則に従ったデータファイルを準備します。データ ファイル名が要件を満たさない場合は、 ファイルパターン使用してインポート タスクを実行することをお勧めします。そうしないと、インポート タスクはインポートするデータ ファイルをスキャンできません。

スキーマファイルの命名規則

このセクションでは、データベースおよびテーブル スキーマ ファイルの命名規則について説明します。スキーマ ファイルの命名規則は、CSV、Parquet、 Aurora Snapshot、SQL のすべてのタイプのソース ファイルで同じです。

スキーマ ファイルの命名規則は次のとおりです。

  • データベース スキーマ ファイル (オプション): ${db_name}-schema-create.sql
  • テーブルスキーマファイル: ${db_name}.${table_name}-schema.sql

以下はデータベース スキーマ ファイルの例です。

  • 名前: import_db-schema-create.sql

  • ファイルの内容:

    CREATE DATABASE import_db;

以下はテーブル スキーマ ファイルの例です。

  • 名前: import_db.test_table-schema.sql

  • ファイルの内容:

    CREATE TABLE test_table ( id INTEGER PRIMARY KEY, val VARCHAR(255) );

データファイルの命名規則

このセクションでは、データ ファイルの命名規則について説明します。ソース ファイルの種類に応じて、データ ファイルの命名規則が異なります。

CSV

CSV ファイルをインポートするときは、データ ファイルに次の名前を付けます。

${db_name}.${table_name}${suffix}.csv.${compress}

${suffix}はオプションで、次の形式のいずれかを指定できますxxxには任意の数字を指定できます。

  • .xxx 、たとえば.01
  • ._xxx_xxx_xxx 、たとえば._0_0_01
  • _xxx_xxx_xxx 、たとえば_0_0_01

${compress}は圧縮形式であり、オプションです。 TiDB Cloud は、 .gzip.gz.zstd.zstおよび.snappyの形式をサポートします。

たとえば、次のすべてのファイルのターゲット データベースとテーブルはimport_dbtest_tableです。

  • import_db.test_table.csv
  • import_db.test_table.01.csv
  • import_db.test_table._0_0_01.csv
  • import_db.test_table_0_0_01.csv
  • import_db.test_table_0_0_01.csv.gz

寄木細工

Parquet ファイルをインポートするときは、データ ファイルに次のような名前を付けます。

${db_name}.${table_name}${suffix}.parquet ( ${suffix}はオプション)

例えば:

  • import_db.test_table.parquet
  • import_db.test_table.01.parquet

Auroraのスナップショット

Aurora Snapshot ファイルの場合、 ${db_name}.${table_name}/フォルダー内の.parquetサフィックスを持つすべてのファイルは命名規則に従います。データ ファイル名には、「az、0 ~ 9、-、_、.」で構成される任意のプレフィックスを含めることができます。接尾辞「.parquet」。

例えば:

  • import_db.test_table/mydata.parquet
  • import_db.test_table/part001/mydata.parquet
  • import_db.test_table/part002/mydata-part002.parquet

SQL

SQL ファイルをインポートするときは、データ ファイルに次のような名前を付けます。

${db_name}.${table_name}${suffix}.sql.${compress}

${suffix}はオプションで、次の形式のいずれかを指定できますxxxには任意の数字を指定できます。

  • .xxx 、たとえば.01
  • ._xxx_xxx_xxx 、たとえば._0_0_01
  • _xxx_xxx_xxx 、たとえば_0_0_01

${compress}は圧縮形式であり、オプションです。 TiDB Cloud は、 .gzip.gz.zstd.zstおよび.snappyの形式をサポートします。

例えば:

  • import_db.test_table.sql
  • import_db.test_table.01.sql
  • import_db.test_table.01.sql.gz

SQL ファイルがデフォルト構成の TiDB Dumplingを介してエクスポートされる場合、デフォルトで命名規則に従います。

ファイルパターン

CSV または Parquet のソース データ ファイルが命名規則に準拠していない場合は、ファイル パターン機能を使用して、ソース データ ファイルとターゲット テーブルの間に名前マッピング関係を確立できます。この機能は、 Auroraスナップショットと SQL データ ファイルをサポートしていません。

このページは役に立ちましたか?

Playground
新規
登録なしで TiDB の機能をワンストップでインタラクティブに体験できます。
製品
TiDB Cloud
TiDB
価格
PoC お問い合わせ
エコシステム
TiKV
TiFlash
OSS Insight
© 2024 PingCAP. All Rights Reserved.
Privacy Policy.