サンプルデータベースのインポート
TiDB マニュアルで使用されている例では、 キャピタル・バイクシェア・データライセンス契約でリリースされた Capital Bikeshare のシステムデータ使用されています。
すべてのデータファイルをダウンロードする
システムデータは年ごとに.zipファイルでダウンロード可能整理されて提供されます。すべてのファイルをダウンロードして解凍するには、約3GBのディスク容量が必要です。bashスクリプトを使用して2010年から2017年までのすべてのファイルをダウンロードするには、以下のコマンドを実行します。
mkdir -p bikeshare-data && cd bikeshare-data
curl -L --remote-name-all https://s3.amazonaws.com/capitalbikeshare-data/{2010..2017}-capitalbikeshare-tripdata.zip
unzip \*-tripdata.zip
TiDBにデータをロードする
次の方法を使用して、システム データを TiDB にインポートできます。
CSV ファイルの名前を変更します。
i=1; for csv in *csv; do mv $csv bikeshare.trips.$(printf "%03d" $i).csv; i=$((i+1)); doneデータベースとテーブルを作成します。
CREATE SCHEMA bikeshare; USE bikeshare; CREATE TABLE trips ( `trip_id` BIGINT NOT NULL PRIMARY KEY AUTO_RANDOM, `duration` INT NOT NULL, `start date` DATETIME, `end date` DATETIME, `start station number` INT, `start station` VARCHAR(255), `end station number` INT, `end station` VARCHAR(255), `bike number` VARCHAR(255), `member type` VARCHAR(255) );次のように
tidb-lightning.toml
ファイルを作成します。[tikv-importer] backend = "tidb" [mydumper] no-schema = true data-source-dir = "~/bikeshare-data" [mydumper.csv] header = true [tidb] host = "127.0.0.1" port = 4000 user = "root" password = "very_secret"次のコマンドを実行します。
tiup tidb-lightning -c tidb-lightning.toml