イギリス
v5.4.0 以降、TiDB は GBK 文字セットをサポートしています。このドキュメントでは、TiDB の GBK 文字セットのサポートと互換性に関する情報を提供します。
SHOW CHARACTER SET WHERE CHARSET = 'gbk';
+---------+-------------------------------------+-------------------+--------+
| Charset | Description | Default collation | Maxlen |
+---------+-------------------------------------+-------------------+--------+
| gbk | Chinese Internal Code Specification | gbk_bin | 2 |
+---------+-------------------------------------+-------------------+--------+
1 row in set (0.00 sec)
SHOW COLLATION WHERE CHARSET = 'gbk';
+----------------+---------+------+---------+----------+---------+
| Collation | Charset | Id | Default | Compiled | Sortlen |
+----------------+---------+------+---------+----------+---------+
| gbk_bin | gbk | 87 | | Yes | 1 |
+----------------+---------+------+---------+----------+---------+
1 rows in set (0.00 sec)
MySQL 互換性
このセクションでは、MySQL と TiDB 間の互換性に関する情報を提供します。
照合順序
MySQL の GBK 文字セットのデフォルトの照合順序はgbk_chinese_ci
です。MySQL とは異なり、TiDB の GBK 文字セットのデフォルトの照合順序はgbk_bin
です。また、TiDB は GBK を UTF8MB4 に変換してからバイナリ照合順序を使用するため、TiDB のgbk_bin
照合順序は MySQL のgbk_bin
照合順序と同じではありません。
TiDB を MySQL GBK 文字セットの照合順序と互換性を持たせるために、TiDB クラスターを最初に初期化するときに、 TiDB Cloud はデフォルトで照合のための新しいフレームワーク有効にします。
照合の新しいフレームワークを有効にした後、GBK 文字セットに対応する照合を確認すると、TiDB GBK のデフォルトの照合順序がgbk_chinese_ci
に変更されていることがわかります。
SHOW CHARACTER SET WHERE CHARSET = 'gbk';
+---------+-------------------------------------+-------------------+--------+
| Charset | Description | Default collation | Maxlen |
+---------+-------------------------------------+-------------------+--------+
| gbk | Chinese Internal Code Specification | gbk_chinese_ci | 2 |
+---------+-------------------------------------+-------------------+--------+
1 row in set (0.00 sec)
SHOW COLLATION WHERE CHARSET = 'gbk';
+----------------+---------+------+---------+----------+---------+
| Collation | Charset | Id | Default | Compiled | Sortlen |
+----------------+---------+------+---------+----------+---------+
| gbk_bin | gbk | 87 | | Yes | 1 |
| gbk_chinese_ci | gbk | 28 | Yes | Yes | 1 |
+----------------+---------+------+---------+----------+---------+
2 rows in set (0.00 sec)
不正な文字の互換性
システム変数
character_set_client
とcharacter_set_connection
同時にgbk
に設定されていない場合、TiDB は MySQL と同じ方法で不正な文字を処理します。character_set_client
とcharacter_set_connection
両方がgbk
に設定されている場合、TiDB は不正な文字を MySQL とは異なる方法で処理します。- MySQL は、読み取り操作と書き込み操作で不正な GBK 文字セットを異なる方法で処理します。
- TiDB は、読み取り操作と書き込み操作で不正な GBK 文字セットを同じ方法で処理します。SQL 厳密モードでは、不正な GBK 文字の読み取りまたは書き込みを行うと、TiDB はエラーを報告します。非厳密モードでは、不正な GBK 文字の読み取りまたは書き込みを行うと、TiDB は不正な GBK 文字を
?
に置き換えます。
例えば、 SET NAMES gbk
後に、 MySQL と TiDB でそれぞれCREATE TABLE gbk_table(a VARCHAR(32) CHARACTER SET gbk)
ステートメントを使用してテーブルを作成し、次の表の SQL ステートメントを実行すると、詳細な違いを確認できます。
データベース | 設定されたSQLモードにSTRICT_ALL_TABLES またはSTRICT_TRANS_TABLES 含まれている場合 | 設定されたSQLモードにSTRICT_ALL_TABLES もSTRICT_TRANS_TABLES 含まれていない場合 |
---|---|---|
マイグレーション | SELECT HEX('一a'); e4b88061 INSERT INTO gbk_table values('一a'); Incorrect Error | SELECT HEX('一a'); e4b88061 INSERT INTO gbk_table VALUES('一a'); SELECT HEX(a) FROM gbk_table; e4b8 |
ティビ | SELECT HEX('一a'); Incorrect Error INSERT INTO gbk_table VALUES('一a'); Incorrect Error | SELECT HEX('一a'); e4b83f INSERT INTO gbk_table VALUES('一a'); SELECT HEX(a) FROM gbk_table; e4b83f |
上記の表では、 utf8mb4
バイト セットのSELECT HEX('a');
の結果はe4b88061
なります。
その他のMySQL互換性
- 現在、TiDB は、
ALTER TABLE
ステートメントを使用して他の文字セット タイプをgbk
に変換したり、gbk
を他の文字セット タイプに変換したりすることはサポートしていません。
TiDB は
_gbk
の使用をサポートしていません。例:CREATE TABLE t(a CHAR(10) CHARSET BINARY); Query OK, 0 rows affected (0.00 sec) INSERT INTO t VALUES (_gbk'啊'); ERROR 1115 (42000): Unsupported character introducer: 'gbk'
現在、
ENUM
およびSET
タイプのバイナリ文字については、TiDB はutf8mb4
文字セットとして処理します。TiDB v7.5.0 では、述語に
LIKE 'prefix%'
などの文字列プレフィックスのLIKE
含まれており、ターゲット列が GBK照合順序(gbk_bin
またはgbk_chinese_ci
) に設定されている場合、オプティマイザーは現在この述語を範囲スキャンに変換できません。代わりに、フルスキャンを実行します。その結果、このような SQL クエリによって予期しないリソース消費が発生する可能性があります。v7.5.1 以降では、この制限はなくなりました。
コンポーネントの互換性
現在、 TiFlash はGBK 文字セットをサポートしていません。
TiDB データ移行 (DM) は、v5.4.0 より前の TiDB クラスターへの
charset=GBK
テーブルの移行をサポートしていません。TiDB Lightning は、 v5.4.0 より前の TiDB クラスターへの
charset=GBK
テーブルのインポートをサポートしていません。v6.1.0 より前のバージョンの TiCDC では、
charset=GBK
テーブルのレプリケーションはサポートされていません。v6.1.0 より前のバージョンの TiCDC では、charset=GBK
テーブルの TiDB クラスターへのレプリケーションはサポートされていません。v5.4.0 より前のバージョンのバックアップと復元 (BR) では、
charset=GBK
テーブルの復元はサポートされていません。v5.4.0 より前のバージョンのBRでは、charset=GBK
テーブルの TiDB クラスターへの復元はサポートされていません。