データ インポートの命名規則

次のファイル形式でTiDB Cloudにデータをインポートできます: CSV、Parquet、 Auroraスナップショット、および SQL。データが正常にインポートされるようにするには、次の 2 種類のファイルを準備する必要があります。

  • スキーマ ファイル.データベース スキーマ ファイル (オプション) とテーブル スキーマ ファイルを両方とも SQL 形式で準備します ( .sql )。テーブル スキーマ ファイルが提供されていない場合は、事前にターゲット データベースに対応するテーブルを手動で作成する必要があります。
  • データ ファイル.データをインポートするための命名規則に準拠したデータ ファイルを準備します。データ ファイル名が要件を満たさない場合は、 ファイル パターンを使用してインポート タスクを実行することをお勧めします。そうしないと、インポート タスクは、インポートするデータ ファイルをスキャンできません。

スキーマ ファイルの命名規則

このセクションでは、データベースおよびテーブル スキーマ ファイルの命名規則について説明します。スキーマ ファイルの命名規則は、CSV、Parquet、 Auroraスナップショット、および SQL のすべての種類のソース ファイルで同じです。

スキーマ ファイルの命名規則は次のとおりです。

  • データベース スキーマ ファイル (オプション): ${db_name}-schema-create.sql
  • テーブル スキーマ ファイル: ${db_name}.${table_name}-schema.sql

以下は、データベース スキーマ ファイルの例です。

  • 名前: import_db-schema-create.sql

  • ファイルの内容:

    CREATE DATABASE import_db;
    

以下は、テーブル スキーマ ファイルの例です。

  • 名前: import_db.test_table-schema.sql

  • ファイルの内容:

    CREATE TABLE test_table (
        id INTEGER PRIMARY KEY,
        val VARCHAR(255)
    );
    

データ ファイルの命名規則

このセクションでは、データ ファイルの命名規則について説明します。ソース ファイルの種類によって、データ ファイルの命名規則は異なります。

CSV

CSV ファイルをインポートするときは、次のようにデータ ファイルに名前を付けます。

  • ${db_name}.${table_name}[.XXXXXX].csv ([.XXXXXX] はオプション)

例えば:

  • import_db.test_table.csv
  • import_db.test_table.01.csv

寄木細工

Parquet ファイルをインポートするときは、次のようにデータ ファイルに名前を付けます。

  • ${db_name}.${table_name}[.XXXXXX].parquet[.{snappy|gz|lzo}] ( [.XXXXXXX][.{snappy|gz|lzo}]はオプション)

例えば:

  • import_db.test_table.parquet
  • import_db.test_table.01.parquet
  • import_db.test_table.parquet.gz
  • import_db.test_table.01.parquet.gz

Auroraのスナップショット

Auroraスナップショット ファイルの場合、 ${db_name}.${table_name}/フォルダー内の.parquetサフィックスを持つすべてのファイルは、命名規則に準拠しています。データ ファイル名には、「az、0-9、-、_、.」で構成されるプレフィックスを含めることができます。接尾辞「.parquet」。

例えば:

  • import_db.test_table/mydata.parquet
  • import_db.test_table/part001/mydata.parquet
  • import_db.test_table/part002/mydata-part002.parquet

SQL

SQL ファイルをインポートするときは、次のようにデータ ファイルに名前を付けます。

  • ${db_name}.${table_name}[.XXXXXXX].sql ([.XXXXXXX] はオプション)

例えば:

  • import_db.test_table.sql
  • import_db.test_table.01.sql

デフォルト設定で TiDB Dumplingを介して SQL ファイルをエクスポートすると、デフォルトで命名規則に準拠します。

ファイルパターン

CSV または Parquet のソース データ ファイルが命名規則に準拠していない場合、ファイル パターン機能を使用して、ソース データ ファイルとターゲット テーブル間の名前マッピング関係を確立できます。この機能は、 Auroraスナップショットと SQL データ ファイルをサポートしていません。

エコシステム
TiDB
TiKV
TiSpark
Chaos Mesh
© 2023 PingCAP. All Rights Reserved.