ローカルファイルをTiDB Cloudにインポートする

ローカル ファイルをTiDB Cloudに直接インポートできます。タスク構成を完了するには数回クリックするだけで、ローカル CSV データが TiDB クラスターにすばやくインポートされます。この方法を使用すると、クラウドstorageバケット パスとロール ARN を指定する必要がありません。インポート プロセス全体が迅速かつスムーズになります。

現在、この方法では、1 つのタスクに対して 1 つの CSV ファイルを既存のテーブルまたは新しいテーブルにインポートすることがサポートされています。

制限事項

  • 現在、 TiDB Cloud は1 つのタスクにつき 50 MiB 以内の CSV 形式のローカル ファイルのインポートのみをサポートしています。
  • ローカル ファイルのインポートは、 TiDB Cloud Serverless クラスターでのみサポートされ、 TiDB Cloud Dedicated クラスターではサポートされません。
  • 複数のインポート タスクを同時に実行することはできません。
  • CSV ファイルをTiDB Cloudの既存のテーブルにインポートし、ターゲット テーブルにソース ファイルよりも多くの列がある場合、状況に応じて余分な列が異なって処理されます。
    • 追加の列が主キーまたは一意のキーでない場合は、エラーは報告されません。代わりに、これらの追加の列にはデフォルト値が入力されます。
    • 追加の列が主キーまたは一意のキーであり、属性auto_incrementまたはauto_randomを持たない場合は、エラーが報告されます。その場合は、次のいずれかの戦略を選択することをお勧めします。
      • これらの主キーまたは一意のキー列を含むソース ファイルを提供します。
      • 主キーまたは一意キー列の属性をauto_incrementまたはauto_randomに設定します。
  • 列名が TiDB で予約済みのキーワードである場合、 TiDB Cloud は自動的にバックティック`追加して列名を囲みます。たとえば、列名がorder場合、 TiDB Cloud は自動的にバックティック`を追加して`order`に変更し、データをターゲット テーブルにインポートします。

ローカルファイルをインポートする

  1. ターゲット クラスターのインポートページを開きます。

    1. TiDB Cloudコンソールにログインし、プロジェクトのクラスターページに移動します。

      ヒント:

      複数のプロジェクトがある場合は、左下隅にある をクリックして、別のプロジェクトに切り替えます。

    2. ターゲット クラスターの名前をクリックして概要ページに移動し、左側のナビゲーション ペインで[インポート]をクリックします。

  2. [**インポート]ページで、ローカル ファイルをアップロード領域に直接ドラッグ アンド ドロップするか、 [ローカル ファイルのアップロード]**をクリックして対象のローカル ファイルを選択してアップロードすることができます。1 つのタスクにつき 50 MiB 未満の CSV ファイルを 1 つだけアップロードできることに注意してください。ローカル ファイルが 50 MiB より大きい場合は、 50 MiB を超えるローカル ファイルをインポートするにはどうすればよいでしょうか?参照してください。

  3. [宛先]セクションで、ターゲット データベースとターゲット テーブルを選択するか、名前を直接入力して新しいデータベースまたは新しいテーブルを作成します。名前は文字 (az と AZ) または数字 (0-9) で始まる必要があり、文字 (az と AZ)、数字 (0-9)、およびアンダースコア (_) 文字を含めることができます。 [テーブルの定義] をクリックすると、 [テーブル定義]セクションが表示されます。

  4. 表を確認してください。

    設定可能なテーブル列のリストが表示されます。各行には、 TiDB Cloudによって推測されたテーブル列名、推測されたテーブル列タイプ、および CSV ファイルからプレビューされたデータが表示されます。

    • TiDB Cloudの既存のテーブルにデータをインポートすると、テーブル定義から列リストが抽出され、プレビューされたデータが列名によって対応する列にマッピングされます。

    • 新しいテーブルを作成する場合は、CSV ファイルから列リストを抽出し、 TiDB Cloudによって列の型が推測されます。たとえば、プレビューされたデータがすべて整数の場合、推測される列の型はint (整数) になります。

  5. 列名とデータ型を構成します。

    CSV ファイルの最初の行に列名が記録されている場合は、デフォルトで選択されている「最初の行を列名として使用する」が選択されていることを確認します。

    CSV ファイルに列名用の行がない場合は、 「最初の行を列名として使用」を選択しないでください。この場合、次のようになります。

    • ターゲット テーブルがすでに存在する場合、CSV ファイル内の列が順番にターゲット テーブルにインポートされます。余分な列は切り捨てられ、不足している列にはデフォルト値が設定されます。

    • TiDB Cloud を使用してターゲット テーブルを作成する必要がある場合は、各列の名前を入力します。列名は次の要件を満たす必要があります。

      • 名前は、文字 (az と AZ)、数字 (0-9)、記号 (中国語や日本語など)、およびアンダースコア ( _ ) 文字のみで構成する必要があります。
      • その他の特殊文字はサポートされていません。
      • 名前の長さは 65 文字未満にする必要があります。

      必要に応じてデータ型を変更することもできます。

  6. 新しいターゲット テーブルでは、主キーを設定できます。主キーとして列を選択するか、複数の列を選択して複合主キーを作成できます。複合主キーは、列名を選択した順序で形成されます。

    注記:

    • テーブルの主キーはクラスター化インデックスであり、作成後に削除することはできません。
    • 主キー フィールドに対応するデータが一意であり、空でないことを確認してください。そうでない場合、インポート タスクでデータの不整合が発生します。
  7. 必要に応じて CSV 構成を編集します。

    また、 「CSV 構成の編集」をクリックして、バックスラッシュ エスケープ、区切り文字、および区切り文字を構成し、よりきめ細かな制御を行うこともできます。CSV 構成の詳細については、 データをインポートするための CSV 構成参照してください。

  8. [インポートの開始]クリックします。

    インポート タスクの詳細ページでインポートの進行状況を確認できます。警告や失敗したタスクがある場合は、詳細を確認して解決できます。

  9. インポート タスクが完了したら、 [SQL エディターでデータを探索]をクリックして、インポートしたデータを照会できます。SQL エディターの使用方法の詳細については、 AI支援SQLエディターでデータを探索参照してください。

  10. [インポート]ページで、 [アクション] 列の[...] > [**ビュー]**をクリックして、インポート タスクの詳細を確認できます。

FAQ

TiDB Cloudのインポート機能を使用して、指定した列のみをインポートできますか?

いいえ。現在、インポート機能を使用する場合、CSV ファイルのすべての列を既存のテーブルにインポートすることしかできません。

指定した列のみをインポートするには、MySQL クライアントを使用して TiDB クラスターに接続し、 LOAD DATA使用してインポートする列を指定します。例:

CREATE TABLE `import_test` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(64) NOT NULL, `address` varchar(64) NOT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB; LOAD DATA LOCAL INFILE 'load.txt' INTO TABLE import_test FIELDS TERMINATED BY ',' (name, address);

mysql使用していてERROR 2068 (HY000): LOAD DATA LOCAL INFILE file request rejected due to restrictions on access.に遭遇した場合は、接続文字列に--local-infile=trueを追加できます。

TiDB Cloudにデータをインポートした後、予約キーワードを含む列をクエリできないのはなぜですか?

列名が TiDB で予約済みのキーワードである場合、 TiDB Cloud は自動的にバックティック`追加して列名を囲み、データをターゲット テーブルにインポートします。列をクエリするときは、バックティック`を追加して列名を囲む必要があります。たとえば、列名がorder場合、 `order`を使用して列をクエリする必要があります。

50 MiB を超えるローカル ファイルをインポートするにはどうすればよいでしょうか?

ファイルが 50 MiB より大きい場合は、 split [-l ${line_count}]ユーティリティを使用して、ファイルを複数の小さなファイルに分割できます (Linux または macOS のみ)。たとえば、 split -l 100000 tidb-01.csv small_files実行すると、 tidb-01.csvという名前のファイルが行の長さ100000で分割され、分割されたファイルの名前はsmall_files${suffix}になります。その後、これらの小さなファイルを 1 つずつTiDB Cloudにインポートできます。

次のスクリプトを参照してください。

#!/bin/bash n=$1 file_path=$2 file_extension="${file_path##*.}" file_name="${file_path%.*}" total_lines=$(wc -l < $file_path) lines_per_file=$(( (total_lines + n - 1) / n )) split -d -a 1 -l $lines_per_file $file_path $file_name. for (( i=0; i<$n; i++ )) do mv $file_name.$i $file_name.$i.$file_extension done

nとファイル名を入力してスクリプトを実行します。スクリプトは元のファイル拡張子を維持しながらファイルをnの均等な部分に分割します。例:

> sh ./split.sh 3 mytest.customer.csv > ls -h | grep mytest mytest.customer.0.csv mytest.customer.1.csv mytest.customer.2.csv mytest.customer.csv

このページは役に立ちましたか?