データインポートの命名規則
データは、CSV、Parquet、 Aurora Snapshot、SQL のファイル形式でTiDB Cloudにインポートできます。データが正常にインポートされていることを確認するには、次の 2 種類のファイルを準備する必要があります。
- スキーマ ファイル。データベース スキーマ ファイル (オプション) とテーブル スキーマ ファイルを両方とも SQL 形式で準備します (
.sql
)。テーブル スキーマ ファイルが提供されていない場合は、事前にターゲット データベースに対応するテーブルを手動で作成する必要があります。 - データファイル。データをインポートするための命名規則に従ったデータファイルを準備します。データ ファイル名が要件を満たさない場合は、 ファイルパターン使用してインポート タスクを実行することをお勧めします。そうしないと、インポート タスクはインポートするデータ ファイルをスキャンできません。
スキーマファイルの命名規則
このセクションでは、データベースおよびテーブル スキーマ ファイルの命名規則について説明します。スキーマ ファイルの命名規則は、CSV、Parquet、 Aurora Snapshot、SQL のすべてのタイプのソース ファイルで同じです。
スキーマ ファイルの命名規則は次のとおりです。
- データベース スキーマ ファイル (オプション):
${db_name}-schema-create.sql
- テーブルスキーマファイル:
${db_name}.${table_name}-schema.sql
以下はデータベース スキーマ ファイルの例です。
名前:
import_db-schema-create.sql
ファイルの内容:
CREATE DATABASE import_db;
以下はテーブル スキーマ ファイルの例です。
名前:
import_db.test_table-schema.sql
ファイルの内容:
CREATE TABLE test_table ( id INTEGER PRIMARY KEY, val VARCHAR(255) );
データファイルの命名規則
このセクションでは、データ ファイルの命名規則について説明します。ソース ファイルの種類に応じて、データ ファイルの命名規則が異なります。
CSV
CSV ファイルをインポートするときは、データ ファイルに次の名前を付けます。
${db_name}.${table_name}${suffix}.csv.${compress}
${suffix}
はオプションで、次の形式のいずれかを指定できますxxx
には任意の数字を指定できます。
.xxx
、たとえば.01
._xxx_xxx_xxx
、たとえば._0_0_01
_xxx_xxx_xxx
、たとえば_0_0_01
${compress}
は圧縮形式であり、オプションです。 TiDB Cloud は、 .gzip
、 .gz
、 .zstd
、 .zst
および.snappy
の形式をサポートします。
たとえば、次のすべてのファイルのターゲット データベースとテーブルはimport_db
とtest_table
です。
import_db.test_table.csv
import_db.test_table.01.csv
import_db.test_table._0_0_01.csv
import_db.test_table_0_0_01.csv
import_db.test_table_0_0_01.csv.gz
寄木細工
Parquet ファイルをインポートするときは、データ ファイルに次のような名前を付けます。
${db_name}.${table_name}${suffix}.parquet
( ${suffix}
はオプション)
例えば:
import_db.test_table.parquet
import_db.test_table.01.parquet
Auroraのスナップショット
Aurora Snapshot ファイルの場合、 ${db_name}.${table_name}/
フォルダー内の.parquet
サフィックスを持つすべてのファイルは命名規則に従います。データ ファイル名には、「az、0 ~ 9、-、_、.」で構成される任意のプレフィックスを含めることができます。接尾辞「.parquet」。
例えば:
import_db.test_table/mydata.parquet
import_db.test_table/part001/mydata.parquet
import_db.test_table/part002/mydata-part002.parquet
SQL
SQL ファイルをインポートするときは、データ ファイルに次のような名前を付けます。
${db_name}.${table_name}${suffix}.sql.${compress}
${suffix}
はオプションで、次の形式のいずれかを指定できますxxx
には任意の数字を指定できます。
.xxx
、たとえば.01
._xxx_xxx_xxx
、たとえば._0_0_01
_xxx_xxx_xxx
、たとえば_0_0_01
${compress}
は圧縮形式であり、オプションです。 TiDB Cloud は、 .gzip
、 .gz
、 .zstd
、 .zst
および.snappy
の形式をサポートします。
例えば:
import_db.test_table.sql
import_db.test_table.01.sql
import_db.test_table.01.sql.gz
SQL ファイルがデフォルト構成の TiDB Dumplingを介してエクスポートされる場合、デフォルトで命名規則に従います。
ファイルパターン
CSV または Parquet のソース データ ファイルが命名規則に準拠していない場合は、ファイル パターン機能を使用して、ソース データ ファイルとターゲット テーブルの間に名前マッピング関係を確立できます。この機能は、 Auroraスナップショットと SQL データ ファイルをサポートしていません。
- CSV ファイルについては、 ステップ 4. CSV ファイルをTiDB Cloudにインポートするのファイル パターンを参照してください。
- Parquet ファイルについては、 ステップ 4. Parquet ファイルをTiDB Cloudにインポートするのファイル パターンを参照してください。