📣

TiDB Cloud Serverless が
Starter
に変わりました!このページは自動翻訳されたものです。
原文はこちらからご覧ください。

データインポートの命名規則

TiDB Cloudには、CSV、Parquet、 Aurora Snapshot、SQL 形式のデータをインポートできます。データを確実にインポートするには、以下の 2 種類のファイルを準備する必要があります。

  • スキーマファイル。データベーススキーマファイル(オプション)とテーブルスキーマファイルをSQL形式( .sql )で用意します。テーブルスキーマファイルが提供されていない場合は、事前に対象データベースに対応するテーブルを手動で作成する必要があります。
  • データファイル。データのインポートに使用する命名規則に準拠したデータファイルを用意してください。データファイル名が要件を満たしていない場合は、 ファイルパターン使用してインポートタスクを実行することをお勧めします。そうでない場合、インポートタスクはインポートするデータファイルをスキャンできません。

スキーマファイルの命名規則

このセクションでは、データベースとテーブルのスキーマファイルの命名規則について説明します。スキーマファイルの命名規則は、CSV、Parquet、 Aurora Snapshot、SQL のすべてのソースファイルで共通です。

スキーマ ファイルの命名規則は次のとおりです。

  • データベーススキーマファイル(オプション): ${db_name}-schema-create.sql
  • テーブルスキーマファイル: ${db_name}.${table_name}-schema.sql

以下はデータベース スキーマ ファイルの例です。

  • 名前: import_db-schema-create.sql

  • ファイルの内容:

    CREATE DATABASE import_db;

以下はテーブル スキーマ ファイルの例です。

  • 名前: import_db.test_table-schema.sql

  • ファイルの内容:

    CREATE TABLE test_table ( id INTEGER PRIMARY KEY, val VARCHAR(255) );

データファイルの命名規則

このセクションでは、データファイルの命名規則について説明します。ソースファイルの種類に応じて、データファイルの命名規則は異なります。

CSV

CSV ファイルをインポートする場合は、データ ファイルに次のように名前を付けます。

${db_name}.${table_name}${suffix}.csv.${compress}

${suffix}はオプションであり、次のいずれかの形式を指定できます。xxx xxx任意の数字です。

  • .xxx (例: .01
  • ._xxx_xxx_xxx (例: ._0_0_01
  • _xxx_xxx_xxx (例: _0_0_01

${compress}は圧縮形式で、オプションです。TiDB TiDB Cloud は.gzip.gz.zstd.zst.snappyの形式をサポートしています。

たとえば、次のすべてのファイルのターゲット データベースとテーブルはimport_dbtest_tableです。

  • import_db.test_table.csv
  • import_db.test_table.01.csv
  • import_db.test_table._0_0_01.csv
  • import_db.test_table_0_0_01.csv
  • import_db.test_table_0_0_01.csv.gz

注記:

Snappy 圧縮ファイルは公式Snappyフォーマットである必要があります。その他の Snappy 圧縮形式はサポートされていません。

寄木細工

Parquet ファイルをインポートするときは、データ ファイルに次のように名前を付けます。

${db_name}.${table_name}${suffix}.parquet${suffix}はオプション)

例えば:

  • import_db.test_table.parquet
  • import_db.test_table.01.parquet

Auroraスナップショット

Aurora Snapshotファイルの場合、 ${db_name}.${table_name}/フォルダ内のサフィックスが.parquetであるすべてのファイルは命名規則に準拠しています。データファイル名には、「az、0-9、-、_、.」からなる任意のプレフィックスと「.parquet」サフィックスを含めることができます。

例えば:

  • import_db.test_table/mydata.parquet
  • import_db.test_table/part001/mydata.parquet
  • import_db.test_table/part002/mydata-part002.parquet

SQL

SQL ファイルをインポートするときは、データ ファイルに次のように名前を付けます。

${db_name}.${table_name}${suffix}.sql.${compress}

${suffix}はオプションであり、次のいずれかの形式を指定できます。xxx xxx任意の数字です。

  • .xxx 、例えば.01
  • ._xxx_xxx_xxx (例: ._0_0_01
  • _xxx_xxx_xxx (例: _0_0_01

${compress}は圧縮形式で、オプションです。TiDB TiDB Cloud は.gzip.gz.zstd.zst.snappyの形式をサポートしています。

例えば:

  • import_db.test_table.sql
  • import_db.test_table.01.sql
  • import_db.test_table.01.sql.gz

SQL ファイルがデフォルト設定で TiDB Dumplingを介してエクスポートされる場合、デフォルトで命名規則に準拠します。

注記:

Snappy 圧縮ファイルは公式Snappyフォーマットである必要があります。その他の Snappy 圧縮形式はサポートされていません。

ファイルパターン

CSVまたはParquetのソースデータファイルが命名規則に準拠していない場合、ファイルパターン機能を使用して、ソースデータファイルとターゲットテーブル間の名前マッピング関係を確立できます。この機能は、 Aurora SnapshotおよびSQLデータファイルはサポートしていません。

このページは役に立ちましたか?