イギリス

v5.4.0 以降、TiDB は GBK 文字セットをサポートしています。このドキュメントでは、TiDB の GBK 文字セットのサポートと互換性に関する情報を提供します。

SHOW CHARACTER SET WHERE CHARSET = 'gbk'; +---------+-------------------------------------+-------------------+--------+ | Charset | Description | Default collation | Maxlen | +---------+-------------------------------------+-------------------+--------+ | gbk | Chinese Internal Code Specification | gbk_bin | 2 | +---------+-------------------------------------+-------------------+--------+ 1 row in set (0.00 sec) SHOW COLLATION WHERE CHARSET = 'gbk'; +----------------+---------+------+---------+----------+---------+ | Collation | Charset | Id | Default | Compiled | Sortlen | +----------------+---------+------+---------+----------+---------+ | gbk_bin | gbk | 87 | | Yes | 1 | +----------------+---------+------+---------+----------+---------+ 1 rows in set (0.00 sec)

MySQL 互換性

このセクションでは、MySQL と TiDB 間の互換性に関する情報を提供します。

照合順序

MySQL の GBK 文字セットのデフォルトの照合順序はgbk_chinese_ciです。MySQL とは異なり、TiDB の GBK 文字セットのデフォルトの照合順序はgbk_binです。また、TiDB は GBK を UTF8MB4 に変換してからバイナリ照合順序を使用するため、TiDB のgbk_bin照合順序は MySQL のgbk_bin照合順序と同じではありません。

TiDB を MySQL GBK 文字セットの照合順序と互換性を持たせるには、最初に TiDB クラスターを初期化するときに、TiDB オプションnew_collations_enabled_on_first_bootstraptrueに設定して照合のための新しいフレームワークを有効にする必要があります。

TiDB を MySQL GBK 文字セットの照合順序と互換性を持たせるために、TiDB クラスターを最初に初期化するときに、 TiDB Cloud はデフォルトで照合のための新しいフレームワーク有効にします。

照合の新しいフレームワークを有効にした後、GBK 文字セットに対応する照合を確認すると、TiDB GBK のデフォルトの照合順序がgbk_chinese_ciに変更されていることがわかります。

SHOW CHARACTER SET WHERE CHARSET = 'gbk'; +---------+-------------------------------------+-------------------+--------+ | Charset | Description | Default collation | Maxlen | +---------+-------------------------------------+-------------------+--------+ | gbk | Chinese Internal Code Specification | gbk_chinese_ci | 2 | +---------+-------------------------------------+-------------------+--------+ 1 row in set (0.00 sec) SHOW COLLATION WHERE CHARSET = 'gbk'; +----------------+---------+------+---------+----------+---------+ | Collation | Charset | Id | Default | Compiled | Sortlen | +----------------+---------+------+---------+----------+---------+ | gbk_bin | gbk | 87 | | Yes | 1 | | gbk_chinese_ci | gbk | 28 | Yes | Yes | 1 | +----------------+---------+------+---------+----------+---------+ 2 rows in set (0.00 sec)

不正な文字の互換性

  • システム変数character_set_clientcharacter_set_connection同時にgbkに設定されていない場合、TiDB は MySQL と同じ方法で不正な文字を処理します。

  • character_set_clientcharacter_set_connection両方がgbkに設定されている場合、TiDB は不正な文字を MySQL とは異なる方法で処理します。

    • MySQL は、読み取り操作と書き込み操作で不正な GBK 文字セットを異なる方法で処理します。
    • TiDB は、読み取り操作と書き込み操作で不正な GBK 文字セットを同じ方法で処理します。SQL 厳密モードでは、不正な GBK 文字の読み取りまたは書き込みを行うと、TiDB はエラーを報告します。非厳密モードでは、不正な GBK 文字の読み取りまたは書き込みを行うと、TiDB は不正な GBK 文字を?に置き換えます。

例えば、 SET NAMES gbk後に、 MySQL と TiDB でそれぞれCREATE TABLE gbk_table(a VARCHAR(32) CHARACTER SET gbk)ステートメントを使用してテーブルを作成し、次の表の SQL ステートメントを実行すると、詳細な違いを確認できます。

データベース設定されたSQLモードにSTRICT_ALL_TABLESまたはSTRICT_TRANS_TABLES含まれている場合設定されたSQLモードにSTRICT_ALL_TABLESSTRICT_TRANS_TABLES含まれていない場合
マイグレーションSELECT HEX('一a');
e4b88061

INSERT INTO gbk_table values('一a');
Incorrect Error
SELECT HEX('一a');
e4b88061

INSERT INTO gbk_table VALUES('一a');
SELECT HEX(a) FROM gbk_table;
e4b8
ティビSELECT HEX('一a');
Incorrect Error

INSERT INTO gbk_table VALUES('一a');
Incorrect Error
SELECT HEX('一a');
e4b83f

INSERT INTO gbk_table VALUES('一a');
SELECT HEX(a) FROM gbk_table;
e4b83f

上記の表では、 utf8mb4バイト セットのSELECT HEX('a');の結果はe4b88061なります。

その他のMySQL互換性

  • 現在、TiDB は、 ALTER TABLEステートメントを使用して他の文字セット タイプをgbkに変換したり、 gbkを他の文字セット タイプに変換したりすることはサポートしていません。
  • TiDB は_gbkの使用をサポートしていません。例:

    CREATE TABLE t(a CHAR(10) CHARSET BINARY); Query OK, 0 rows affected (0.00 sec) INSERT INTO t VALUES (_gbk'啊'); ERROR 1115 (42000): Unsupported character introducer: 'gbk'
  • 現在、 ENUMおよびSETタイプのバイナリ文字については、TiDB はutf8mb4文字セットとして処理します。

  • TiDB v7.5.0 では、述語にLIKE 'prefix%'などの文字列プレフィックスのLIKE含まれており、ターゲット列が GBK照合順序( gbk_binまたはgbk_chinese_ci ) に設定されている場合、オプティマイザーは現在この述語を範囲スキャンに変換できません。代わりに、フルスキャンを実行します。その結果、このような SQL クエリによって予期しないリソース消費が発生する可能性があります。v7.5.1 以降では、この制限はなくなりました。

コンポーネントの互換性

  • 現在、 TiFlash はGBK 文字セットをサポートしていません。

  • TiDB データ移行 (DM) は、v5.4.0 より前の TiDB クラスターへのcharset=GBKテーブルの移行をサポートしていません。

  • TiDB Lightning は、 v5.4.0 より前の TiDB クラスターへのcharset=GBKテーブルのインポートをサポートしていません。

  • v6.1.0 より前のバージョンの TiCDC では、 charset=GBKテーブルのレプリケーションはサポートされていません。v6.1.0 より前のバージョンの TiCDC では、 charset=GBKテーブルの TiDB クラスターへのレプリケーションはサポートされていません。

  • v5.4.0 より前のバージョンのバックアップと復元 (BR) では、 charset=GBKテーブルの復元はサポートされていません。v5.4.0 より前のバージョンのBRでは、 charset=GBKテーブルの TiDB クラスターへの復元はサポートされていません。

このページは役に立ちましたか?

Playground
登録なしで TiDB の機能をワンストップでインタラクティブに体験できます。
製品
TiDB Dedicated
TiDB Serverless
TiDB
価格
PoC お問い合わせ
エコシステム
TiKV
TiFlash
OSS Insight
© 2024 PingCAP. All Rights Reserved.
Privacy Policy.