文字列関数

TiDB は、MySQL 8.0 で利用可能な文字列関数のほとんどと、Oracle 21 で利用可能な関数の一部をサポートしています。

サポートされている関数

`ASCII()`

ASCII(str)関数は、指定された引数の左端の文字のASCII値を取得するために使用されます。引数は文字列または数値のいずれかです。

引数が空でない場合、関数は左端の文字の ASCII 値を返します。
引数が空の文字列の場合、関数は0返します。
引数がNULLの場合、関数はNULL返します。

注記：
ASCII(str) 、8 ビットの 2 進数 (1 バイト) を使用して表される文字に対してのみ機能します。

例：

SELECT ASCII('A'), ASCII('TiDB'), ASCII(23);

出力：

+------------+---------------+-----------+
| ASCII('A') | ASCII('TiDB') | ASCII(23) |
+------------+---------------+-----------+
|         65 |            84 |        50 |
+------------+---------------+-----------+

`BIN()`

BIN()関数は、指定された引数をそのバイナリ値の文字列表現に変換します。引数は文字列または数値のいずれかです。

引数が正の数の場合、関数はそのバイナリ値の文字列表現を返します。
引数が負の数の場合、関数は引数の絶対値をその 2 進表現に変換し、2 進値の各ビットを反転し ( 0を1に、 1を0に変更)、反転した値に1加算します。
引数が数字のみを含む文字列の場合、関数はその数字に応じた結果を返します。例えば、 "123"と123の結果は同じになります。
引数が文字列で、その最初の文字が数字ではない場合 ( "q123"など)、関数は0返します。
引数が数字と非数字を含む文字列の場合、関数は引数の先頭の連続する数字に基づいて結果を返します。例えば、 "123q123"と123の結果は同じですが、 BIN('123q123')場合はTruncated incorrect INTEGER value: '123q123'ような警告が生成されます。
引数がNULLの場合、関数はNULL返します。

例1:

SELECT BIN(123), BIN('123q123');

出力1:

+----------+----------------+
| BIN(123) | BIN('123q123') |
+----------+----------------+
| 1111011  | 1111011        |
+----------+----------------+

例2:

SELECT BIN(-7);

出力2:

+------------------------------------------------------------------+
| BIN(-7)                                                          |
+------------------------------------------------------------------+
| 1111111111111111111111111111111111111111111111111111111111111001 |
+------------------------------------------------------------------+

`BIT_LENGTH()`

BIT_LENGTH()関数は、指定された引数の長さをビット単位で返すために使用されます。

例:

SELECT BIT_LENGTH("TiDB");

+--------------------+
| BIT_LENGTH("TiDB") |
+--------------------+
|                 32 |
+--------------------+

1文字あたり8ビット×4文字＝32ビット

SELECT BIT_LENGTH("PingCAP 123");

+---------------------------+
| BIT_LENGTH("PingCAP 123") |
+---------------------------+
|                        88 |
+---------------------------+

1文字あたり8ビット（スペースは英数字ではないためカウントされます）×11文字 = 88ビット

SELECT CustomerName, BIT_LENGTH(CustomerName) AS BitLengthOfName FROM Customers;

+--------------------+-----------------+
| CustomerName       | BitLengthOfName |
+--------------------+-----------------+
| Albert Einstein    |             120 |
| Robert Oppenheimer |             144 |
+--------------------+-----------------+

注記：
上記の例は、 Customersという名前のテーブルと、テーブル内にCustomerNameという名前の列を持つデータベースが存在するという前提で動作します。

`CHAR()`

CHAR()関数は、特定のASCII値に対応する文字を取得するために使用されます。これは、特定の文字のASCII値を返すASCII()の逆の操作を行います。複数の引数が指定された場合、この関数はすべての引数に対して処理を行い、それらを連結します。

例:

SELECT CHAR(65);

+------------+
|  CHAR(65)  |
+------------+
|          A |
+------------+

SELECT CHAR(84);

+------------+
|  CHAR(84)  |
+------------+
|          T |
+------------+

CHAR()関数は、標準の ASCII 範囲 ( 0 - 127 ) を超える ASCII 値の対応する文字を取得するためにも使用できます。

/*For extended ASCII: */

SELECT CHAR(128);

+------------+
|  CHAR(128) |
+------------+
|       0x80 |
+------------+

CHAR()関数は、Unicode 値に対応する文字値を取得することもできます。

/* For Unicode: */

--skip-binary-as-hex

SELECT CHAR(50089);

+--------------+
|  CHAR(50089) |
+--------------+
|            é |
+--------------+

SELECT CHAR(65,66,67);

+----------------+
| CHAR(65,66,67) |
+----------------+
| ABC            |
+----------------+
1 row in set (0.00 sec)

`CHAR_LENGTH()`

CHAR_LENGTH()関数は、指定された引数内の文字の合計数を整数として取得するために使用されます。

例:

SELECT CHAR_LENGTH("TiDB") AS LengthOfString;

+----------------+
| LengthOfString |
+----------------+
|              4 |
+----------------+

SELECT CustomerName, CHAR_LENGTH(CustomerName) AS LengthOfName FROM Customers;

+--------------------+--------------+
| CustomerName       | LengthOfName |
+--------------------+--------------+
| Albert Einstein    |           15 |
| Robert Oppenheimer |           18 |
+--------------------+--------------+

注記：
上記の例は、 Customersという名前のテーブルと、テーブル内にCustomerNameという名前の列を持つデータベースが存在するという前提で動作します。

`CHARACTER_LENGTH()`

関数CHARACTER_LENGTH()は関数CHAR_LENGTH()と同じです。どちらの関数も同じ出力を生成するため、同義語として使用できます。

`CONCAT()`

CONCAT()関数は、1 つ以上の引数を 1 つの文字列に連結します。

構文：

CONCAT(str1,str2,...)

str1, str2, ...は連結される引数のリストです。各引数は文字列または数値です。

例：

SELECT CONCAT('TiDB', ' ', 'Server', '-', 1, TRUE);

出力：

+---------------------------------------------+
| CONCAT('TiDB', ' ', 'Server', '-', 1, TRUE) |
+---------------------------------------------+
| TiDB Server-11                              |
+---------------------------------------------+

引数のいずれかがNULLの場合、 CONCAT() NULL返します。

例：

SELECT CONCAT('TiDB', NULL, 'Server');

出力：

+--------------------------------+
| CONCAT('TiDB', NULL, 'Server') |
+--------------------------------+
| NULL                           |
+--------------------------------+

CONCAT()関数に加えて、次の例のように文字列を隣接させて連結することもできます。ただし、この方法は数値型をサポートしていないことに注意してください。

SELECT 'Ti' 'DB' ' ' 'Server';

出力：

+-------------+
| Ti          |
+-------------+
| TiDB Server |
+-------------+

`CONCAT_WS()`

CONCAT_WS()関数は、セパレーター付きのCONCAT()の形式で、指定されたセパレーターで連結された文字列を返します。

構文：

CONCAT_WS(separator,str1,str2,...)

separator : 最初の引数はセパレーターであり、 NULL以外の残りの引数を連結します。
str1, str2, ... : 連結する引数のリスト。各引数は文字列または数値です。

例：

SELECT CONCAT_WS(',', 'TiDB Server', 'TiKV', 'PD');

出力：

+---------------------------------------------+
| CONCAT_WS(',', 'TiDB Server', 'TiKV', 'PD') |
+---------------------------------------------+
| TiDB Server,TiKV,PD                         |
+---------------------------------------------+

セパレータが空の文字列の場合、 CONCAT_WS() CONCAT()と同等となり、残りの引数を連結した文字列を返します。

例：

SELECT CONCAT_WS('', 'TiDB Server', 'TiKV', 'PD');

出力：

+--------------------------------------------+
| CONCAT_WS('', 'TiDB Server', 'TiKV', 'PD') |
+--------------------------------------------+
| TiDB ServerTiKVPD                          |
+--------------------------------------------+

区切り文字がNULLの場合、 CONCAT_WS() NULL返します。

例：

SELECT CONCAT_WS(NULL, 'TiDB Server', 'TiKV', 'PD');

出力：

+----------------------------------------------+
| CONCAT_WS(NULL, 'TiDB Server', 'TiKV', 'PD') |
+----------------------------------------------+
| NULL                                         |
+----------------------------------------------+

連結される引数の 1 つだけがNULLでない場合、 CONCAT_WS()その引数を返します。

例：

SELECT CONCAT_WS(',', 'TiDB Server', NULL);

出力：

+-------------------------------------+
| CONCAT_WS(',', 'TiDB Server', NULL) |
+-------------------------------------+
| TiDB Server                         |
+-------------------------------------+

連結する引数がNULLある場合、 CONCAT_WS()これらNULL引数をスキップします。

例：

SELECT CONCAT_WS(',', 'TiDB Server', NULL, 'PD');

出力：

+-------------------------------------------+
| CONCAT_WS(',', 'TiDB Server', NULL, 'PD') |
+-------------------------------------------+
| TiDB Server,PD                            |
+-------------------------------------------+

連結する空の文字列がある場合、 CONCAT_WS()空の文字列をスキップしません。

例：

SELECT CONCAT_WS(',', 'TiDB Server', '', 'PD');

出力：

+-----------------------------------------+
| CONCAT_WS(',', 'TiDB Server', '', 'PD') |
+-----------------------------------------+
| TiDB Server,,PD                         |
+-----------------------------------------+

`ELT()`

ELT()関数はインデックス番号の要素を返します。

SELECT ELT(3, 'This', 'is', 'TiDB');

+------------------------------+
| ELT(3, 'This', 'is', 'TiDB') |
+------------------------------+
| TiDB                         |
+------------------------------+
1 row in set (0.00 sec)

上記の例では、 3 番目の要素である'TiDB'返します。

`EXPORT_SET()`

EXPORT_SET()関数は、指定された数（ number_of_bits ）のonまたはoffの値からなる文字列を返します。これらの値は、オプションでseparatorで区切られます。これらの値は、 bits引数の対応するビットが1であるかどうかに基づいて決定されます。最初の値はbitsの右端（最下位）ビットに対応します。

構文：

EXPORT_SET(bits, on, off, [separator[, number_of_bits]])

bits : ビット値を表す整数。
on : 対応するビットが1場合に返される文字列。
off : 対応するビットが0場合に返される文字列。
separator (オプション): 結果文字列の区切り文字。
number_of_bits （オプション）: 処理するビット数。設定されていない場合は、デフォルトで64 （最大ビット数）が使用され、 bits符号なし64ビット整数として扱われます。

例:

次の例では、 number_of_bits 5に設定され、 |で区切られた 5 つの値が生成されます。3 ビットしか指定されていないため、残りのビットは未設定とみなされます。したがって、 number_of_bitsを101または00101に設定しても同じ出力になります。

SELECT EXPORT_SET(b'101',"ON",'off','|',5);

+-------------------------------------+
| EXPORT_SET(b'101',"ON",'off','|',5) |
+-------------------------------------+
| ON|off|ON|off|off                   |
+-------------------------------------+
1 row in set (0.00 sec)

次の例では、 bitsが00001111に、 onがxに、 offが_に設定されています。これにより、関数は0ビットに対して____ 、 1ビットに対してxxxx返します。したがって、 00001111のビットを右から左に処理すると、関数はxxxx____返します。

SELECT EXPORT_SET(b'00001111', 'x', '_', '', 8);

+------------------------------------------+
| EXPORT_SET(b'00001111', 'x', '_', '', 8) |
+------------------------------------------+
| xxxx____                                 |
+------------------------------------------+
1 row in set (0.00 sec)

次の例では、 bitsが00001111に、 onがxに、 offが_に設定されています。これにより、関数は1ビットごとにx 、 0ビットごとに_返します。したがって、 01010101ビットを右から左に処理すると、関数はx_x_x_x_返します。

SELECT EXPORT_SET(b'01010101', 'x', '_', '', 8);

+------------------------------------------+
| EXPORT_SET(b'01010101', 'x', '_', '', 8) |
+------------------------------------------+
| x_x_x_x_                                 |
+------------------------------------------+
1 row in set (0.00 sec)

`FIELD()`

後続の引数の最初の引数のインデックス (位置) を返します。

次の例では、 FIELD()の最初の引数はneedleあり、次のリストの 2 番目の引数と一致するため、関数は2返します。

SELECT FIELD('needle', 'A', 'needle', 'in', 'a', 'haystack');
+-------------------------------------------------------+
| FIELD('needle', 'A', 'needle', 'in', 'a', 'haystack') |
+-------------------------------------------------------+
|                                                     2 |
+-------------------------------------------------------+
1 row in set (0.00 sec)

`FIND_IN_SET()`

2 番目の引数内の最初の引数のインデックス位置を返します。

この関数は、 SETデータ型でよく使用されます。

次の例では、 GoはセットCOBOL,BASIC,Rust,Go,Java,Fortranの 4 番目の要素なので、関数は4返します。

SELECT FIND_IN_SET('Go', 'COBOL,BASIC,Rust,Go,Java,Fortran');
+-------------------------------------------------------+
| FIND_IN_SET('Go', 'COBOL,BASIC,Rust,Go,Java,Fortran') |
+-------------------------------------------------------+
|                                                     4 |
+-------------------------------------------------------+
1 row in set (0.00 sec)

`FORMAT()`

FORMAT(X,D[,locale])関数は、数値X "#,###,###. ##"と同様の形式にフォーマットし、小数点以下D桁に丸めて、結果を文字列として返すために使用されます。

引数:

X : 書式設定する数値。数値、数値文字列、または科学的記数法の数値を指定できます。
D : 返される値の小数点以下の桁数。この関数は、数値を小数点以下XからD桁に丸めます。8 X実際の小数点以下の桁数よりもD大きい場合、結果の長さに合わせて0が補われます。
[locale] : 小数点の区切り、千単位の区切り、および結果の数値の区切りに使用するロケール設定を指定します。有効なロケール値は、システム変数lc_time_namesの有効な値と同じです。指定されていない場合、または地域設定がNULL場合、デフォルトで地域設定'en_US'が使用されます。この引数はオプションです。

動作:

最初の引数が文字列で、数値のみを含む場合、関数はその数値に基づいて結果を返します。例えば、 FORMAT('12.34', 1)とFORMAT(12.34, 1)同じ結果を返します。
最初の引数が科学的記数法（ E/e使用）で表された数値の場合、関数はその数値に基づいて結果を返します。例えば、 FORMAT('1E2', 3)場合は100.000返します。
最初の引数が数値以外の文字で始まる文字列の場合、関数は0と警告(Code 1292)を返します。例えば、 FORMAT('q12.36', 5)場合は0.00000返しますが、警告Warning (Code 1292): Truncated incorrect DOUBLE value: 'q12.36'も含まれます。
最初の引数が数値と非数値が混在する文字列の場合、関数は引数の先頭の連続する数値部分に基づいて結果を返しますが、警告(Code 1292)も表示されます。例えば、 FORMAT('12.36q56.78', 1) FORMAT('12.36', 1)と同じ数値を返しますが、警告Warning (Code 1292): Truncated incorrect DOUBLE value: '12.36q56.78'が表示されます。
2 番目の引数が 0 または負の数の場合、関数は小数部分を切り捨てて整数を返します。
引数のいずれかがNULLの場合、関数はNULL返します。

例:

次の例は、数値 12.36 をさまざまな小数点以下の桁にフォーマットする方法を示しています。

mysql> SELECT FORMAT(12.36, 1);
+------------------+
| FORMAT(12.36, 1) |
+------------------+
| 12.4             |
+------------------+

mysql> SELECT FORMAT(12.36, 5);
+------------------+
| FORMAT(12.36, 5) |
+------------------+
| 12.36000         |
+------------------+

mysql> SELECT FORMAT(12.36, 2);
+------------------+
| FORMAT(12.36, 2) |
+------------------+
| 12.36            |
+------------------+

`FROM_BASE64()`

FROM_BASE64()関数は、ベース64エンコードされた文字列をデコードし、デコードされた結果を 16 進形式で返すために使用されます。

この関数は、デコードする Base64 でエンコードされた文字列という単一の引数を受け入れます。
引数がNULLであるか、有効な Base64 エンコードされた文字列でない場合、 FROM_BASE64()関数はNULL返します。

例:

次の例は、Base64でエンコードされた文字列'SGVsbG8gVGlEQg=='をデコードする方法を示しています。この文字列は、 TO_BASE64()関数を使用して'Hello TiDB'エンコードした結果です。

mysql> SELECT TO_BASE64('Hello TiDB');
+-------------------------+
| TO_BASE64('Hello TiDB') |
+-------------------------+
| SGVsbG8gVGlEQg==        |
+-------------------------+

mysql> SELECT FROM_BASE64('SGVsbG8gVGlEQg==');
+------------------------------------------------------------------+
| FROM_BASE64('SGVsbG8gVGlEQg==')                                  |
+------------------------------------------------------------------+
| 0x48656C6C6F2054694442                                           |
+------------------------------------------------------------------+

mysql> SELECT CONVERT(FROM_BASE64('SGVsbG8gVGlEQg==') USING utf8mb4);
+--------------------------------------------------------+
| CONVERT(FROM_BASE64('SGVsbG8gVGlEQg==') USING utf8mb4) |
+--------------------------------------------------------+
| Hello TiDB                                             |
+--------------------------------------------------------+

次の例は、Base64でエンコードされた数値MTIzNDU2をデコードする方法を示しています。この文字列は、 TO_BASE64()関数を使用してエンコードされた123456の結果です。

mysql> SELECT FROM_BASE64('MTIzNDU2');
+--------------------------------------------------+
| FROM_BASE64('MTIzNDU2')                          |
+--------------------------------------------------+
| 0x313233343536                                   |
+--------------------------------------------------+

`HEX()`

HEX()関数は、指定された引数をその16進数値の文字列表現に変換します。引数は文字列または数値のいずれかです。

引数が文字列の場合、 HEX(str) strの16進文字列表現を返します。この関数は、 strの各文字の各バイトを2桁の16進数に変換します。例えば、UTF-8またはASCII文字セットの文字a 2進値では00111101 、16進表記では61として表されます。
引数が数値の場合、 HEX(n) nの16進文字列表現を返します。この関数は引数n BIGINTとして扱い、これはCONV(n, 10, 16)使用するのと同じ意味になります。
引数がNULLの場合、関数はNULL返します。

注記：
MySQLクライアントでは、インタラクティブモードではデフォルトで--binary-as-hexオプションが有効になっており、不明な文字セットを持つデータは16進数リテラルとして表示されます。この動作を無効にするには、 --skip-binary-as-hexオプションを使用します。

例（ mysql --skip-binary-as-hex ）:

SELECT X'616263', HEX('abc'), UNHEX(HEX('abc')), 0x616263;
+-----------+------------+-------------------+----------+
| X'616263' | HEX('abc') | UNHEX(HEX('abc')) | 0x616263 |
+-----------+------------+-------------------+----------+
| abc       | 616263     | abc               | abc      |
+-----------+------------+-------------------+----------+

SELECT X'F09F8DA3', HEX('🍣'), UNHEX(HEX('🍣')), 0xF09F8DA3;
+-------------+-------------+--------------------+------------+
| X'F09F8DA3' | HEX('🍣')     | UNHEX(HEX('🍣'))     | 0xF09F8DA3 |
+-------------+-------------+--------------------+------------+
| 🍣            | F09F8DA3    | 🍣                   | 🍣           |
+-------------+-------------+--------------------+------------+

SELECT HEX(255), CONV(HEX(255), 16, 10);
+----------+------------------------+
| HEX(255) | CONV(HEX(255), 16, 10) |
+----------+------------------------+
| FF       | 255                    |
+----------+------------------------+

SELECT HEX(NULL);
+-----------+
| HEX(NULL) |
+-----------+
| NULL      |
+-----------+

`INSERT()`

INSERT(str, pos, len, newstr)関数は、 str内の部分文字列（位置posから始まり、長さlen文字）を文字列newstrに置き換えるために使用されます。この関数はマルチバイトセーフです。

pos strの長さを超える場合、関数は変更せずに元の文字列strを返します。
len位置posからの残りの長さstrを超える場合、関数は位置posからの残りの文字列を置き換えます。
いずれかの引数がNULLの場合、関数はNULL返します。

例:

SELECT INSERT('He likes tennis', 4, 5, 'plays');
+------------------------------------------+
| INSERT('He likes tennis', 4, 5, 'plays') |
+------------------------------------------+
| He plays tennis                          |
+------------------------------------------+

SELECT INSERT('He likes tennis', -1, 5, 'plays');
+-------------------------------------------+
| INSERT('He likes tennis', -1, 5, 'plays') |
+-------------------------------------------+
| He likes tennis                           |
+-------------------------------------------+

SELECT INSERT('He likes tennis', 4, 100, 'plays');
+--------------------------------------------+
| INSERT('He likes tennis', 4, 100, 'plays') |
+--------------------------------------------+
| He plays                                   |
+--------------------------------------------+

SELECT INSERT('He likes tenis', 10, 100, '🍣');
+-------------------------------------------+
| INSERT('He likes tenis', 10, 100, '🍣')     |
+-------------------------------------------+
| He likes 🍣                                 |
+-------------------------------------------+

SELECT INSERT('あああああああ', 2, 3, 'いいい');
+----------------------------------------------------+
| INSERT('あああああああ', 2, 3, 'いいい')           |
+----------------------------------------------------+
| あいいいあああ                                     |
+----------------------------------------------------+

SELECT INSERT('あああああああ', 2, 3, 'xx');
+---------------------------------------------+
| INSERT('あああああああ', 2, 3, 'xx')        |
+---------------------------------------------+
| あxxあああ                                  |
+---------------------------------------------+

`INSTR()`

INSTR(str, substr)関数は、 strにおけるsubstrの最初の出現位置を取得するために使用されます。各引数は文字列または数値のいずれかです。この関数は、引数が2つのLOCATE(substr, str)関数と同じですが、引数の順序が逆になっています。

注記：
INSTR(str, substr)の大文字と小文字の区別は、TiDB で使用される照合によって決まります。バイナリ照合順序（サフィックスが_bin ）では大文字と小文字が区別されますが、一般照合順序（サフィックスが_general_ciまたは_ai_ci ）では大文字と小文字は区別されません。

いずれかの引数が数値の場合、関数はその数値を文字列として扱います。
substr strに含まれない場合、この関数は0返します。そうでない場合は、 strにおけるsubstrの最初の出現位置を返します。
いずれかの引数がNULL場合、関数はNULL返します。

例:

SELECT INSTR("pingcap.com", "tidb");

+------------------------------+
| INSTR("pingcap.com", "tidb") |
+------------------------------+
|                            0 |
+------------------------------+

SELECT INSTR("pingcap.com/tidb", "tidb");

+-----------------------------------+
| INSTR("pingcap.com/tidb", "tidb") |
+-----------------------------------+
|                                13 |
+-----------------------------------+

SELECT INSTR("pingcap.com/tidb" COLLATE utf8mb4_bin, "TiDB");

+-------------------------------------------------------+
| INSTR("pingcap.com/tidb" COLLATE utf8mb4_bin, "TiDB") |
+-------------------------------------------------------+
|                                                     0 |
+-------------------------------------------------------+

SELECT INSTR("pingcap.com/tidb" COLLATE utf8mb4_general_ci, "TiDB");

+--------------------------------------------------------------+
| INSTR("pingcap.com/tidb" COLLATE utf8mb4_general_ci, "TiDB") |
+--------------------------------------------------------------+
|                                                           13 |
+--------------------------------------------------------------+

SELECT INSTR(0123, "12");

+-------------------+
| INSTR(0123, "12") |
+-------------------+
|                 1 |
+-------------------+

`LCASE()`

LCASE(str)関数はLOWER(str)の同義語で、指定された引数の小文字を返します。

`LEFT()`

LEFT()関数は、文字列の左側から指定された数の文字を返します。

構文：

LEFT(`str`, `len`)

str : 文字を抽出する元の文字列。2 strマルチバイト文字が含まれている場合、関数はそれを単一のコードポイントとしてカウントします。
len : 返される文字の長さ。
- len 0 以下の場合、関数は空の文字列を返します。
- len strの長さ以上である場合、関数は元のstrを返します。
いずれかの引数がNULLの場合、関数はNULL返します。

例:

SELECT LEFT('ABCED', 3);
+------------------+
| LEFT('ABCED', 3) |
+------------------+
| ABC              |
+------------------+

SELECT LEFT('ABCED', 6);
+------------------+
| LEFT('ABCED', 6) |
+------------------+
| ABCED            |
+------------------+

SELECT LEFT('ABCED', 0);
+------------------+
| LEFT('ABCED', 0) |
+------------------+
|                  |
+------------------+

SELECT LEFT('ABCED', -1);
+-------------------+
| LEFT('ABCED', -1) |
+-------------------+
|                   |
+-------------------+

SELECT LEFT('🍣ABC', 3);
+--------------------+
| LEFT('🍣ABC', 3)     |
+--------------------+
| 🍣AB                 |
+--------------------+

SELECT LEFT('ABC', NULL);
+-------------------+
| LEFT('ABC', NULL) |
+-------------------+
| NULL              |
+-------------------+

SELECT LEFT(NULL, 3);
+------------------------------+
| LEFT(NULL, 3)                |
+------------------------------+
| NULL                         |
+------------------------------+

`LENGTH()`

LENGTH()関数は文字列の長さをバイト単位で返します。

LENGTH()マルチバイト文字を複数バイトとしてカウントし、 CHAR_LENGTH()マルチバイト文字を単一のコードポイントとしてカウントします。

引数がNULLの場合、関数はNULL返します。

例:

SELECT LENGTH('ABC');
+---------------+
| LENGTH('ABC') |
+---------------+
|             3 |
+---------------+

SELECT LENGTH('🍣ABC');
+-------------------+
| LENGTH('🍣ABC')     |
+-------------------+
|                 7 |
+-------------------+

SELECT CHAR_LENGTH('🍣ABC');
+------------------------+
| CHAR_LENGTH('🍣ABC')     |
+------------------------+
|                      4 |
+------------------------+

SELECT LENGTH(NULL);
+--------------+
| LENGTH(NULL) |
+--------------+
|         NULL |
+--------------+

`LIKE`

LIKE演算子は単純な文字列マッチングに使用されます。式expr LIKE pat [ESCAPE 'escape_char'] 1 ( TRUE ) または0 ( FALSE ) を返します。13 またはexpr patいずれかがNULLの場合、結果はNULLなります。

LIKEでは次の 2 つのワイルドカードパラメータを使用できます。

% 、ゼロ文字を含む任意の数の文字に一致します。
_ 1 つの文字と一致します。

次の例では、 utf8mb4_bin照合順序を使用しています。

SET collation_connection='utf8mb4_bin';
SHOW VARIABLES LIKE 'collation_connection';
+----------------------+-------------+
| Variable_name        | Value       |
+----------------------+-------------+
| collation_connection | utf8mb4_bin |
+----------------------+-------------+

SELECT NULL LIKE '%' as result;
+--------+
| result |
+--------+
|   NULL |
+--------+

SELECT 'sushi!!!' LIKE 'sushi_' AS result;
+--------+
| result |
+--------+
|      0 |
+--------+

SELECT '🍣🍺sushi🍣🍺' LIKE '%sushi%' AS result;
+--------+
| result |
+--------+
|      1 |
+--------+

SELECT '🍣🍺sushi🍣🍺' LIKE '%SUSHI%' AS result;
+--------+
| result |
+--------+
|      0 |
+--------+

SELECT '🍣🍺sushi🍣🍺' LIKE '%🍣%' AS result;
+--------+
| result |
+--------+
|      1 |
+--------+

デフォルトのエスケープ文字は\です。

SELECT 'sushi!!!' LIKE 'sushi\_' AS result;
+--------+
| result |
+--------+
|      0 |
+--------+

SELECT 'sushi_' LIKE 'sushi\_' AS result;
+--------+
| result |
+--------+
|      1 |
+--------+

*などの別のエスケープ文字を指定するには、 ESCAPE句を使用します。

SELECT 'sushi_' LIKE 'sushi*_' ESCAPE '*' AS result;
+--------+
| result |
+--------+
|      1 |
+--------+

SELECT 'sushi!' LIKE 'sushi*_' ESCAPE '*' AS result;
+--------+
| result |
+--------+
|      0 |
+--------+

LIKE演算子を使用して数値を一致させることができます。

SELECT 10 LIKE '1%' AS result;
+--------+
| result |
+--------+
|      1 |
+--------+

SELECT 10000 LIKE '12%' AS result;
+--------+
| result |
+--------+
|      0 |
+--------+

utf8mb4_unicode_ciなどの照合順序を明示的に指定するには、 COLLATE使用します。

SELECT '🍣🍺Sushi🍣🍺' COLLATE utf8mb4_unicode_ci LIKE '%SUSHI%' AS result;
+--------+
| result |
+--------+
|      1 |
+--------+

`LOCATE()`

LOCATE(substr, str[, pos])関数は、文字列str内で指定された部分文字列substrが最初に出現する位置を取得するために使用されます。引数posはオプションであり、検索の開始位置を指定します。

部分文字列substr strに存在しない場合、関数は0返します。
いずれかの引数がNULLの場合、関数はNULL返します。
この関数はマルチバイトセーフであり、少なくとも 1 つの引数がバイナリ文字列である場合にのみ大文字と小文字を区別した検索を実行します。

次の例では、 utf8mb4_bin照合順序を使用しています。

SET collation_connection='utf8mb4_bin';
SHOW VARIABLES LIKE 'collation_connection';
+----------------------+-------------+
| Variable_name        | Value       |
+----------------------+-------------+
| collation_connection | utf8mb4_bin |
+----------------------+-------------+

SELECT LOCATE('bar', 'foobarbar');
+----------------------------+
| LOCATE('bar', 'foobarbar') |
+----------------------------+
|                          4 |
+----------------------------+

SELECT LOCATE('baz', 'foobarbar');
+----------------------------+
| LOCATE('baz', 'foobarbar') |
+----------------------------+
|                          0 |
+----------------------------+

SELECT LOCATE('bar', 'fooBARBAR');
+----------------------------+
| LOCATE('bar', 'fooBARBAR') |
+----------------------------+
|                          0 |
+----------------------------+

SELECT LOCATE('bar', 'foobarBAR', 100);
+---------------------------------+
| LOCATE('bar', 'foobarBAR', 100) |
+---------------------------------+
|                               0 |
+---------------------------------+

SELECT LOCATE('bar', 'foobarbar', 5);
+-------------------------------+
| LOCATE('bar', 'foobarbar', 5) |
+-------------------------------+
|                             7 |
+-------------------------------+

SELECT LOCATE('bar', NULL);
+---------------------+
| LOCATE('bar', NULL) |
+---------------------+
|                NULL |
+---------------------+

SELECT LOCATE('い', 'たいでぃーびー');
+----------------------------------------+
| LOCATE('い', 'たいでぃーびー')         |
+----------------------------------------+
|                                      2 |
+----------------------------------------+

SELECT LOCATE('い', 'たいでぃーびー', 3);
+-------------------------------------------+
| LOCATE('い', 'たいでぃーびー', 3)         |
+-------------------------------------------+
|                                         0 |
+-------------------------------------------+

次の例では、 utf8mb4_unicode_ci照合順序を使用しています。

SET collation_connection='utf8mb4_unicode_ci';
SHOW VARIABLES LIKE 'collation_connection';
+----------------------+--------------------+
| Variable_name        | Value              |
+----------------------+--------------------+
| collation_connection | utf8mb4_unicode_ci |
+----------------------+--------------------+

SELECT LOCATE('い', 'たいでぃーびー', 3);
+-------------------------------------------+
| LOCATE('い', 'たいでぃーびー', 3)         |
+-------------------------------------------+
|                                         4 |
+-------------------------------------------+

SELECT LOCATE('🍺', '🍣🍣🍣🍺🍺');
+----------------------------------------+
| LOCATE('🍺', '🍣🍣🍣🍺🍺')            |
+----------------------------------------+
|                                      1 |
+----------------------------------------+

次のマルチバイト文字列とバイナリ文字列の例では、 utf8mb4_bin照合順序が使用されています。

SET collation_connection='utf8mb4_bin';
SHOW VARIABLES LIKE 'collation_connection';
+----------------------+-------------+
| Variable_name        | Value       |
+----------------------+-------------+
| collation_connection | utf8mb4_bin |
+----------------------+-------------+

SELECT LOCATE('🍺', '🍣🍣🍣🍺🍺');
+----------------------------------------+
| LOCATE('🍺', '🍣🍣🍣🍺🍺')                         |
+----------------------------------------+
|                                      4 |
+----------------------------------------+

SELECT LOCATE('b', _binary'aBcde');
+-----------------------------+
| LOCATE('b', _binary'aBcde') |
+-----------------------------+
|                           0 |
+-----------------------------+

SELECT LOCATE('B', _binary'aBcde');
+-----------------------------+
| LOCATE('B', _binary'aBcde') |
+-----------------------------+
|                           2 |
+-----------------------------+

SELECT LOCATE(_binary'b', 'aBcde');
+-----------------------------+
| LOCATE(_binary'b', 'aBcde') |
+-----------------------------+
|                           0 |
+-----------------------------+

SELECT LOCATE(_binary'B', 'aBcde');
+-----------------------------+
| LOCATE(_binary'B', 'aBcde') |
+-----------------------------+
|                           2 |
+-----------------------------+

`LOWER()`

LOWER(str)関数は、指定された引数strのすべての文字を小文字に変換します。引数は文字列または数値のいずれかです。

引数が文字列の場合、関数は小文字で文字列を返します。
引数が数値の場合、関数は先頭のゼロを除いた数値を返します。
引数がNULLの場合、関数はNULL返します。

例:

SELECT LOWER("TiDB");

+---------------+
| LOWER("TiDB") |
+---------------+
| tidb          |
+---------------+

SELECT LOWER(-012);

+-------------+
| LOWER(-012) |
+-------------+
| -12         |
+-------------+

`LPAD()`

LPAD(str, len, padstr)関数は、指定された文字列padstrを左側に埋め込んでlen文字の長さにした文字列引数を返します。

len文字列strの長さより短い場合、関数は文字列strをlenの長さに切り捨てます。
lenが負の数の場合、関数はNULL返します。
いずれかの引数がNULLの場合、関数はNULL返します。

例:

SELECT LPAD('TiDB',8,'>');
+--------------------+
| LPAD('TiDB',8,'>') |
+--------------------+
| >>>>TiDB           |
+--------------------+
1 row in set (0.00 sec)

SELECT LPAD('TiDB',2,'>');
+--------------------+
| LPAD('TiDB',2,'>') |
+--------------------+
| Ti                 |
+--------------------+
1 row in set (0.00 sec)

SELECT LPAD('TiDB',-2,'>');
+---------------------+
| LPAD('TiDB',-2,'>') |
+---------------------+
| NULL                |
+---------------------+
1 row in set (0.00 sec)

`LTRIM()`

LTRIM()関数は、指定された文字列の先頭のスペースを削除します。

引数がNULLの場合、この関数はNULL返します。

注記：
この関数は、スペース文字 (U+0020) のみを削除し、タブ (U+0009) やノーブレークスペース (U+00A0) などの他のスペースのような文字は削除しません。

例:

次の例では、 LTRIM()関数は' hello'の先頭のスペースを削除し、 hello返します。

SELECT LTRIM('    hello');

+--------------------+
| LTRIM('    hello') |
+--------------------+
| hello              |
+--------------------+
1 row in set (0.00 sec)

次の例では、 CONCAT()使ってLTRIM(' hello')の結果を«と»で囲んでいます。この書式設定により、先頭のスペースがすべて削除されていることが少しわかりやすくなります。

SELECT CONCAT('«',LTRIM('    hello'),'»');

+------------------------------------+
| CONCAT('«',LTRIM('    hello'),'»') |
+------------------------------------+
| «hello»                            |
+------------------------------------+
1 row in set (0.00 sec)

`MAKE_SET()`

MAKE_SET()関数は、 bits引数の対応するビットが1に設定されているかどうかに基づいて、コンマで区切られた文字列のセットを返します。

構文：

MAKE_SET(bits, str1, str2, ...)

bits : 結果セットに含める後続の文字列引数を制御します。2 bits NULLに設定されている場合、関数はNULL返します。
str1, str2, ... : 文字列のリスト。各文字列は、引数bits右から左へのビットに対応します。4 str1右から最初のビット、 str2右から2番目のビットに対応し、以下同様です。対応するビットが1の場合、文字列は結果に含まれます。それ以外の場合は含まれません。

例:

次の例では、引数bitsのすべてのビットが0に設定されているため、関数は結果に後続の文字列を含めず、空の文字列を返します。

SELECT MAKE_SET(b'000','foo','bar','baz');

+------------------------------------+
| MAKE_SET(b'000','foo','bar','baz') |
+------------------------------------+
|                                    |
+------------------------------------+
1 row in set (0.00 sec)

次の例では、右から最初のビットのみが1あるため、関数は最初の文字列fooのみを返します。

SELECT MAKE_SET(b'001','foo','bar','baz');

+------------------------------------+
| MAKE_SET(b'001','foo','bar','baz') |
+------------------------------------+
| foo                                |
+------------------------------------+
1 row in set (0.00 sec)

次の例では、右から 2 番目のビットのみが1あるため、関数は 2 番目の文字列barのみを返します。

SELECT MAKE_SET(b'010','foo','bar','baz');

+------------------------------------+
| MAKE_SET(b'010','foo','bar','baz') |
+------------------------------------+
| bar                                |
+------------------------------------+
1 row in set (0.00 sec)

次の例では、右から 3 番目のビットのみが1あるため、関数は 3 番目の文字列bazのみを返します。

SELECT MAKE_SET(b'100','foo','bar','baz');

+------------------------------------+
| MAKE_SET(b'100','foo','bar','baz') |
+------------------------------------+
| baz                                |
+------------------------------------+
1 row in set (0.00 sec)

次の例では、すべてのビットが1あるため、関数は 3 つの文字列すべてをコンマ区切りの結果セットで返します。

SELECT MAKE_SET(b'111','foo','bar','baz');

+------------------------------------+
| MAKE_SET(b'111','foo','bar','baz') |
+------------------------------------+
| foo,bar,baz                        |
+------------------------------------+
1 row in set (0.0002 sec)

`MID()`

MID(str, pos[, len])関数は、指定されたpos位置から始まり、長さがlen部分文字列を返します。

TiDB v8.4.0以降、2つの引数を持つバリアントMID(str, pos)がサポートされます。3 len指定されていない場合、この関数は指定されたpos番目の位置から文字列の末尾までの残りのすべての文字を返します。

引数のいずれかがNULLの場合、関数はNULL返します。

例:

次の例では、 MID()入力文字列の 2 番目の文字 ( b ) から始まる3文字の長さの部分文字列を返します。

SELECT MID('abcdef',2,3);

+-------------------+
| MID('abcdef',2,3) |
+-------------------+
| bcd               |
+-------------------+
1 row in set (0.00 sec)

次の例では、 MID()入力文字列の 2 番目の文字 ( b ) から文字列の末尾までの部分文字列を返します。

SELECT MID('abcdef',2);

+-------------------+
| MID('abcdef',2)   |
+-------------------+
| bcdef             |
+-------------------+
1 row in set (0.00 sec)

`NOT LIKE`

単純なパターンマッチングの否定。

この関数はLIKEの逆演算を実行します。

例:

次の例では、 aaa a%パターンと一致するため、 NOT LIKE 0 (False) を返します。

SELECT 'aaa' LIKE 'a%', 'aaa' NOT LIKE 'a%';

+-----------------+---------------------+
| 'aaa' LIKE 'a%' | 'aaa' NOT LIKE 'a%' |
+-----------------+---------------------+
|               1 |                   0 |
+-----------------+---------------------+
1 row in set (0.00 sec)

次の例では、 aaa b%パターンと一致しないため、 NOT LIKE 1 (True) を返します。

SELECT 'aaa' LIKE 'b%', 'aaa' NOT LIKE 'b%';

+-----------------+---------------------+
| 'aaa' LIKE 'b%' | 'aaa' NOT LIKE 'b%' |
+-----------------+---------------------+
|               0 |                   1 |
+-----------------+---------------------+
1 row in set (0.00 sec)

`NOT REGEXP`

REGEXPの否定。

`OCT()`

数値の8進数 (基数 8) 表現を含む文字列を返します。

例:

次の例では、再帰共通テーブル式（CTE）を使って0から20までの数値の列を生成し、関数OCT()を使って各数値を8進数表現に変換します。0から7までの10進数値は、8進数でも同じ表現になります。8から15までの10進数値は、10から17までの8進数値に対応します。

WITH RECURSIVE nr(n) AS (
    SELECT 0 AS n
    UNION ALL
    SELECT n+1 FROM nr WHERE n<20
)
SELECT n, OCT(n) FROM nr;

+------+--------+
| n    | OCT(n) |
+------+--------+
|    0 | 0      |
|    1 | 1      |
|    2 | 2      |
|    3 | 3      |
|    4 | 4      |
|    5 | 5      |
|    6 | 6      |
|    7 | 7      |
|    8 | 10     |
|    9 | 11     |
|   10 | 12     |
|   11 | 13     |
|   12 | 14     |
|   13 | 15     |
|   14 | 16     |
|   15 | 17     |
|   16 | 20     |
|   17 | 21     |
|   18 | 22     |
|   19 | 23     |
|   20 | 24     |
+------+--------+
20 rows in set (0.00 sec)

`OCTET_LENGTH()`

LENGTH()の同義語。

`ORD()`

指定された引数の左端の文字の文字コードを返します。

この関数はCHAR()と似ていますが、動作は逆になります。

例:

aとA例にとると、 ORD() aに対して97返し、 Aに対して65を返します。

SELECT ORD('a'), ORD('A');

+----------+----------+
| ORD('a') | ORD('A') |
+----------+----------+
|       97 |       65 |
+----------+----------+
1 row in set (0.00 sec)

ORD()で取得した文字コードを入力として受け取ると、 CHAR()関数を使用して元の文字を復元できます。出力形式は、MySQLクライアントでbinary-as-hexオプションが有効になっているかどうかによって異なる場合がありますのでご注意ください。

SELECT CHAR(97), CHAR(65);

+----------+----------+
| CHAR(97) | CHAR(65) |
+----------+----------+
| a        | A        |
+----------+----------+
1 row in set (0.01 sec)

次の例は、 ORD()マルチバイト文字をどのように処理するかを示しています。ここで、 101と0x65はどちらもe番目の文字の UTF-8 エンコードされた値ですが、形式が異なります。また、 50091と0xC3ABどちらもë番目の文字の同じ値です。

SELECT ORD('e'), ORD('ë'), HEX('e'), HEX('ë');

+----------+-----------+----------+-----------+
| ORD('e') | ORD('ë')  | HEX('e') | HEX('ë')  |
+----------+-----------+----------+-----------+
|      101 |     50091 | 65       | C3AB      |
+----------+-----------+----------+-----------+
1 row in set (0.00 sec)

`POSITION()`

LOCATE()の同義語。

`QUOTE()`

SQL ステートメントで使用するために引数をエスケープします。

引数がNULLの場合、関数はNULL返します。

例：

16 進数でエンコードされた値を表示する代わりに結果を直接表示するには、MySQL クライアントを--skip-binary-as-hexオプションで起動する必要があります。

次の例では、ASCII NULL 文字が\0としてエスケープされ、一重引用符文字' \'としてエスケープされていることを示しています。

SELECT QUOTE(0x002774657374);

+-----------------------+
| QUOTE(0x002774657374) |
+-----------------------+
| '\0\'test'            |
+-----------------------+
1 row in set (0.00 sec)

`REGEXP`

正規表現を使用したパターンマッチング。

例:

この例では、いくつかの文字列が 2 つの正規表現と照合されます。

WITH vals AS (
    SELECT 'TiDB' AS v
    UNION ALL
    SELECT 'Titanium'
    UNION ALL
    SELECT 'Tungsten'
    UNION ALL
    SELECT 'Rust'
)
SELECT
    v,
    v REGEXP '^Ti' AS 'starts with "Ti"',
    v REGEXP '^.{4}$' AS 'Length is 4 characters'
FROM
    vals;

+----------+------------------+------------------------+
| v        | starts with "Ti" | Length is 4 characters |
+----------+------------------+------------------------+
| TiDB     |                1 |                      1 |
| Titanium |                1 |                      0 |
| Tungsten |                0 |                      0 |
| Rust     |                0 |                      1 |
+----------+------------------+------------------------+
4 rows in set (0.00 sec)

次の例は、 REGEXP SELECT節に限定されないことを示しています。例えば、クエリのWHERE節でも使用できます。

SELECT
    v
FROM (
        SELECT 'TiDB' AS v
    ) AS vals
WHERE
    v REGEXP 'DB$';

+------+
| v    |
+------+
| TiDB |
+------+
1 row in set (0.01 sec)

`REGEXP_INSTR()`

正規表現に一致する部分文字列の開始インデックスを返します（MySQLと部分的に互換性があります。詳細についてはMySQLとの正規表現の互換性参照してください）。

REGEXP_INSTR(str, regexp, [start, [match, [ret, [match_type]]]])関数は正規表現（ regexp ）が文字列（ str ）と一致する場合、一致した位置を返します。

strまたはregexpいずれかがNULLの場合、関数はNULL返します。

例:

以下の例では、 ^.b.$ abc一致していることがわかります。

SELECT REGEXP_INSTR('abc','^.b.$');

+-----------------------------+
| REGEXP_INSTR('abc','^.b.$') |
+-----------------------------+
|                           1 |
+-----------------------------+
1 row in set (0.00 sec)

次の例では、3 番目の引数を使用して、文字列内の異なる開始位置との一致を検索します。

SELECT REGEXP_INSTR('abcabc','a');

+----------------------------+
| REGEXP_INSTR('abcabc','a') |
+----------------------------+
|                          1 |
+----------------------------+
1 row in set (0.00 sec)

SELECT REGEXP_INSTR('abcabc','a',2);

+------------------------------+
| REGEXP_INSTR('abcabc','a',2) |
+------------------------------+
|                            4 |
+------------------------------+
1 row in set (0.00 sec)

次の例では、4 番目の引数を使用して 2 番目の一致を検索します。

SELECT REGEXP_INSTR('abcabc','a',1,2);

+--------------------------------+
| REGEXP_INSTR('abcabc','a',1,2) |
+--------------------------------+
|                              4 |
+--------------------------------+
1 row in set (0.00 sec)

次の例では、5 番目の引数を使用して、一致の値ではなく、一致後の値を返します。

SELECT REGEXP_INSTR('abcabc','a',1,1,1);

+----------------------------------+
| REGEXP_INSTR('abcabc','a',1,1,1) |
+----------------------------------+
|                                2 |
+----------------------------------+
1 row in set (0.00 sec)

次の例では、6番目の引数にフラグiを追加して、大文字と小文字を区別しない一致を取得しています。正規表現match_type詳細については、 match_type互換性参照してください。

SELECT REGEXP_INSTR('abcabc','A',1,1,0,'');

+-------------------------------------+
| REGEXP_INSTR('abcabc','A',1,1,0,'') |
+-------------------------------------+
|                                   0 |
+-------------------------------------+
1 row in set (0.00 sec)

SELECT REGEXP_INSTR('abcabc','A',1,1,0,'i');

+--------------------------------------+
| REGEXP_INSTR('abcabc','A',1,1,0,'i') |
+--------------------------------------+
|                                    1 |
+--------------------------------------+
1 row in set (0.00 sec)

match_typeに加えて、照合順序もマッチングに影響します。次の例では、大文字と小文字を区別する照合と区別しない照合順序を使用してこれを示しています。

SELECT REGEXP_INSTR('abcabc','A' COLLATE utf8mb4_general_ci);

+-------------------------------------------------------+
| REGEXP_INSTR('abcabc','A' COLLATE utf8mb4_general_ci) |
+-------------------------------------------------------+
|                                                     1 |
+-------------------------------------------------------+
1 row in set (0.01 sec)

SELECT REGEXP_INSTR('abcabc','A' COLLATE utf8mb4_bin);

+------------------------------------------------+
| REGEXP_INSTR('abcabc','A' COLLATE utf8mb4_bin) |
+------------------------------------------------+
|                                              0 |
+------------------------------------------------+
1 row in set (0.00 sec)

`REGEXP_LIKE()`

文字列が正規表現に一致するかどうか（MySQLと部分的に互換性があります。詳細についてはMySQLとの正規表現の互換性参照してください）。

REGEXP_LIKE(str, regex, [match_type])関数は、正規表現が文字列に一致するかどうかをテストするために使用されます。オプションでmatch_typeを使用して、一致の動作を変更することもできます。

例:

次の例は、 ^a abc一致することを示しています。

SELECT REGEXP_LIKE('abc','^a');

+-------------------------+
| REGEXP_LIKE('abc','^a') |
+-------------------------+
|                       1 |
+-------------------------+
1 row in set (0.00 sec)

次の例は、 ^A abc一致しないことを示しています。

SELECT REGEXP_LIKE('abc','^A');

+-------------------------+
| REGEXP_LIKE('abc','^A') |
+-------------------------+
|                       0 |
+-------------------------+
1 row in set (0.00 sec)

この例では、 ^A abcに一致しますが、これは大文字と小文字を区別しない一致を有効にするiフラグによって一致します。正規表現match_type詳細については、 match_type互換性参照してください。

SELECT REGEXP_LIKE('abc','^A','i');

+-----------------------------+
| REGEXP_LIKE('abc','^A','i') |
+-----------------------------+
|                           1 |
+-----------------------------+
1 row in set (0.00 sec)

`REGEXP_REPLACE()`

正規表現に一致する部分文字列を置き換えます（MySQLと部分的に互換性があります。詳しくはMySQLとの正規表現の互換性参照してください）。

REGEXP_REPLACE(str, regexp, replace, [start, [match, [match_type]]])関数は、正規表現に基づいて文字列を置換するために使用できます。

例:

次の例では、 2 つの o がiに置き換えられます。

SELECT REGEXP_REPLACE('TooDB', 'o{2}', 'i');

+--------------------------------------+
| REGEXP_REPLACE('TooDB', 'o{2}', 'i') |
+--------------------------------------+
| TiDB                                 |
+--------------------------------------+
1 row in set (0.00 sec)

次の例では、3 番目の文字から一致が開始され、正規表現は一致せず、置換も行われません。

SELECT REGEXP_REPLACE('TooDB', 'o{2}', 'i',3);

+----------------------------------------+
| REGEXP_REPLACE('TooDB', 'o{2}', 'i',3) |
+----------------------------------------+
| TooDB                                  |
+----------------------------------------+
1 row in set (0.00 sec)

次の例では、5 番目の引数を使用して、置換に最初の一致を使用するか、2 番目の一致を使用するかを設定します。

SELECT REGEXP_REPLACE('TooDB', 'o', 'i',1,1);

+---------------------------------------+
| REGEXP_REPLACE('TooDB', 'o', 'i',1,1) |
+---------------------------------------+
| TioDB                                 |
+---------------------------------------+
1 row in set (0.00 sec)

SELECT REGEXP_REPLACE('TooDB', 'o', 'i',1,2);

+---------------------------------------+
| REGEXP_REPLACE('TooDB', 'o', 'i',1,2) |
+---------------------------------------+
| ToiDB                                 |
+---------------------------------------+
1 row in set (0.00 sec)

次の例では、6番目の引数にmatch_type設定して大文字と小文字を区別しない一致を指定しています。正規表現match_type詳細については、 match_type互換性参照してください。

SELECT REGEXP_REPLACE('TooDB', 'O{2}','i',1,1);

+-----------------------------------------+
| REGEXP_REPLACE('TooDB', 'O{2}','i',1,1) |
+-----------------------------------------+
| TooDB                                   |
+-----------------------------------------+
1 row in set (0.00 sec)

SELECT REGEXP_REPLACE('TooDB', 'O{2}','i',1,1,'i');

+---------------------------------------------+
| REGEXP_REPLACE('TooDB', 'O{2}','i',1,1,'i') |
+---------------------------------------------+
| TiDB                                        |
+---------------------------------------------+
1 row in set (0.00 sec)

`REGEXP_SUBSTR()`

正規表現に一致する部分文字列を返します（MySQLと部分的に互換性があります。詳細についてはMySQLとの正規表現の互換性参照してください）。

REGEXP_SUBSTR(str, regexp, [start, [match, [match_type]]])関数は、正規表現に基づいて部分文字列を取得するために使用されます。

次の例では、正規表現Ti.{2}を使用して、文字列This is TiDBのTiDB番目の部分文字列を取得します。

SELECT REGEXP_SUBSTR('This is TiDB','Ti.{2}');

+----------------------------------------+
| REGEXP_SUBSTR('This is TiDB','Ti.{2}') |
+----------------------------------------+
| TiDB                                   |
+----------------------------------------+
1 row in set (0.00 sec)

`REPEAT()`

文字列を指定された回数繰り返します。

例:

次の例では、再帰共通テーブル式（CTE）を使って1から20までの数字のシーケンスを生成します。シーケンス内の各数字に対して、文字xがその数字と同じ回数繰り返されます。

WITH RECURSIVE nr(n) AS (
    SELECT 1 AS n
    UNION ALL
    SELECT n+1 FROM nr WHERE n<20
)
SELECT n, REPEAT('x',n) FROM nr;

+------+----------------------+
| n    | REPEAT('x',n)        |
+------+----------------------+
|    1 | x                    |
|    2 | xx                   |
|    3 | xxx                  |
|    4 | xxxx                 |
|    5 | xxxxx                |
|    6 | xxxxxx               |
|    7 | xxxxxxx              |
|    8 | xxxxxxxx             |
|    9 | xxxxxxxxx            |
|   10 | xxxxxxxxxx           |
|   11 | xxxxxxxxxxx          |
|   12 | xxxxxxxxxxxx         |
|   13 | xxxxxxxxxxxxx        |
|   14 | xxxxxxxxxxxxxx       |
|   15 | xxxxxxxxxxxxxxx      |
|   16 | xxxxxxxxxxxxxxxx     |
|   17 | xxxxxxxxxxxxxxxxx    |
|   18 | xxxxxxxxxxxxxxxxxx   |
|   19 | xxxxxxxxxxxxxxxxxxx  |
|   20 | xxxxxxxxxxxxxxxxxxxx |
+------+----------------------+
20 rows in set (0.01 sec)

次の例は、 REPEAT()複数の文字で構成される文字列に対して操作できることを示しています。

SELECT REPEAT('ha',3);

+----------------+
| REPEAT('ha',3) |
+----------------+
| hahaha         |
+----------------+
1 row in set (0.00 sec)

`REPLACE()`

指定された文字列の出現を置き換えます。

`REVERSE()`

文字列内の文字を逆にします。

`RIGHT()`

指定された右端の文字数を返します。

`RLIKE`

REGEXPの同義語。

`RPAD()`

指定された回数だけ文字列を追加します。

`RTRIM()`

末尾のスペースを削除します。

`SPACE()`

指定された数のスペースを含む文字列を返します。

`STRCMP()`

2 つの文字列を比較します。

`SUBSTR()`

指定されたとおりに部分文字列を返します。

`SUBSTRING()`

指定されたとおりに部分文字列を返します。

`SUBSTRING_INDEX()`

SUBSTRING_INDEX()関数は、指定された区切り文字とカウントに基づいて文字列から部分文字列を抽出するために使用されます。この関数は、CSVデータの解析やログファイルの処理など、特定の区切り文字で区切られたデータを扱う場合に特に便利です。

構文：

SUBSTRING_INDEX(str, delim, count)

str : 処理する文字列を指定します。
delim : 文字列内の区切り文字を指定します。大文字と小文字が区別されます。
count : 区切り文字の出現回数を指定します。
- countが正の数の場合、関数は区切り文字のcount目の出現の前の部分文字列 (文字列の左から数えて) を返します。
- countが負の数の場合、関数は区切り文字のcount目の出現後 (文字列の右から数えて) の部分文字列を返します。
- countが0の場合、関数は空の文字列を返します。

例1:

SELECT SUBSTRING_INDEX('www.tidbcloud.com', '.', 2);

出力1:

+-----------------------------------------+
| SUBSTRING_INDEX('www.tidbcloud.com', '.', 2) |
+-----------------------------------------+
| www.tidbcloud                                |
+-----------------------------------------+

例2:

SELECT SUBSTRING_INDEX('www.tidbcloud.com', '.', -1);

出力2:

+------------------------------------------+
| SUBSTRING_INDEX('www.tidbcloud.com', '.', -1) |
+------------------------------------------+
| com                                      |
+------------------------------------------+

`TO_BASE64()`

TO_BASE64()関数は、指定された引数をBase64エンコードされた文字列に変換し、現在の接続の文字セットと照合順序に従って結果を返します。Base64エンコードされた文字列は、 FROM_BASE64()関数を使用してデコードできます。

構文：

TO_BASE64(str)

引数が文字列でない場合、関数はそれを base-64 エンコードする前に文字列に変換します。
引数がNULLの場合、関数はNULL返します。

例1:

SELECT TO_BASE64('abc');

出力1:

+------------------+
| TO_BASE64('abc') |
+------------------+
| YWJj             |
+------------------+

例2:

SELECT TO_BASE64(6);

出力2:

+--------------+
| TO_BASE64(6) |
+--------------+
| Ng==         |
+--------------+

`TRANSLATE()`

文字列中のすべての文字を他の文字に置き換えます。Oracleのように空文字列をNULLとして扱いません。

`TRIM()`

先頭と末尾のスペースを削除します。

`UCASE()`

UCASE()関数は文字列を大文字に変換するために使用されます。この関数はUPPER()関数と同等です。

注記：
文字列が null の場合、 UCASE()関数はNULL返します。

例：

SELECT UCASE('bigdata') AS result_upper, UCASE(null) AS result_null;

出力：

+--------------+-------------+
| result_upper | result_null |
+--------------+-------------+
| BIGDATA      | NULL        |
+--------------+-------------+

`UNHEX()`

UNHEX()関数はHEX()関数の逆の操作を実行します。引数内の各文字ペアを16進数として扱い、その数値で表される文字に変換し、結果をバイナリ文字列として返します。

注記：
引数は0 ～ 9 、 A ～ F 、またはa ～ fを含む有効な16進数値でなければなりません。引数がNULLまたはこの範囲外の場合、関数はNULL返します。
MySQLクライアントでは、インタラクティブモードではデフォルトで--binary-as-hexオプションが有効になっており、不明な文字セットを持つデータは16進数リテラルとして表示されます。この動作を無効にするには、 --skip-binary-as-hexオプションを使用します。

例：

SELECT UNHEX('54694442');

出力：

+--------------------------------------+
| UNHEX('54694442')                    |
+--------------------------------------+
| 0x54694442                           |
+--------------------------------------+

`UPPER()`

UPPER()関数は文字列を大文字に変換するために使用されます。この関数はUCASE()関数と同等です。

注記：
文字列が null の場合、 UPPER()関数はNULL返します。

例：

SELECT UPPER('bigdata') AS result_upper, UPPER(null) AS result_null;

出力：

+--------------+-------------+
| result_upper | result_null |
+--------------+-------------+
| BIGDATA      | NULL        |
+--------------+-------------+

`WEIGHT_STRING()`

WEIGHT_STRING()関数は、入力文字列の重み文字列（バイナリ文字）を返します。これは主に、複数文字セットのシナリオにおけるソートや比較演算に使用されます。引数がNULLの場合、 NULL返します。構文は次のとおりです。

WEIGHT_STRING(str [AS {CHAR|BINARY}(N)])

str : 入力文字列式。2、4、6 TEXTの非バイナリ文字列の場合、戻り値VARCHARは文字列の照合順序重みが含まれます。8、10、12 BLOBのBINARY VARBINARY列の場合、戻り値CHAR入力値と同じになります。
AS {CHAR|BINARY}(N) : 出力のタイプと長さを指定するために使用されるオプションのパラメータ。2 CHAR文字データ型を表し、 BINARYバイナリデータ型を表します。6 N出力長を指定します。これは 1 以上の整数です。

注記：
N文字列の長さより短い場合、文字列は切り捨てられます。3 N文字列の長さを超える場合、 AS CHAR(N)指定された長さになるまで文字列にスペースを埋め込み、 AS BINARY(N)指定された長さになるまで文字列に0x00埋め込みます。

例：

SET NAMES 'utf8mb4';
SELECT HEX(WEIGHT_STRING('ab' AS CHAR(3))) AS char_result, HEX(WEIGHT_STRING('ab' AS BINARY(3))) AS binary_result;

出力：

+-------------+---------------+
| char_result | binary_result |
+-------------+---------------+
| 6162        | 616200        |
+-------------+---------------+

サポートされていない関数

LOAD_FILE()
MATCH()
SOUNDEX()

MySQLとの正規表現の互換性

次のセクションでは、 REGEXP_INSTR() 、 REGEXP_LIKE() 、 REGEXP_REPLACE() 、 REGEXP_SUBSTR()を含む、MySQL との正規表現の互換性について説明します。

構文の互換性

MySQLはInternational Components for Unicode (ICU)を使用して正規表現を実装し、TiDBはRE2を使用しています。2つのライブラリの構文の違いについては、 ICUの文書とRE2 構文を参照してください。

`match_type`互換性

TiDB と MySQL 間のmatch_typeの値オプションは次のとおりです。

TiDB の値オプションは"c" 、 "i" 、 "m" 、 "s"であり、MySQL の値オプションは"c" 、 "i" 、 "m" 、 "n" 、 "u"です。
TiDBの"s"はMySQLの"n"に相当します。TiDBで"s"設定されている場合、 .は行末文字（ \n ）にも一致します。
たとえば、MySQL のSELECT REGEXP_LIKE(a, b, "n") FROM t1 TiDB のSELECT REGEXP_LIKE(a, b, "s") FROM t1と同じです。
TiDB は、MySQL で Unix のみの行末を意味する"u"サポートしていません。

`match_type`	MySQL	ティドブ	説明
c	はい	はい	大文字と小文字を区別する一致
私	はい	はい	大文字と小文字を区別しないマッチング
メートル	はい	はい	複数行モード
s	いいえ	はい	改行に一致します。MySQLの`n`と同じです。
n	はい	いいえ	改行に一致します。TiDB の`s`と同じです。
あなた	はい	いいえ	UNIX™ の行末

データ型の互換性

バイナリ文字列型に対する TiDB と MySQL のサポートの違い:

MySQL 8.0.22以降、正規表現関数ではバイナリ文字列をサポートしていません。詳細についてはMySQLドキュメントを参照してください。ただし、実際には、すべてのパラメータまたは戻り値の型がバイナリ文字列である場合、MySQLで正規関数は正常に動作します。それ以外の場合は、エラーが報告されます。
現在、TiDB ではバイナリ文字列の使用が禁止されており、どのような状況でもエラーが報告されます。

その他の互換性

TiDBにおける空文字列の置換動作はMySQLとは異なりますREGEXP_REPLACE("", "^$", "123")例に挙げます。
- MySQL は空の文字列を置き換えず、結果として""返します。
- TiDB は空の文字列を置き換え、結果として"123"返します。
TiDBでグループをキャプチャするために使用するキーワードはMySQLとは異なります。MySQLではキーワードとして$使用しますが、TiDBでは\\使用します。また、TiDBは0から9の番号のグループのみをキャプチャできます。
たとえば、次の SQL ステートメントは TiDB にab返します。
```
SELECT REGEXP_REPLACE('abcd','(.*)(.{2})$','\\1') AS s;
```

既知の問題

GitHub の問題 #37981

文字列関数

サポートされている関数

ASCII()

BIN()

BIT_LENGTH()

CHAR()

CHAR_LENGTH()

CHARACTER_LENGTH()

CONCAT()

CONCAT_WS()

ELT()

EXPORT_SET()

FIELD()

FIND_IN_SET()

FORMAT()

FROM_BASE64()

HEX()

INSERT()

INSTR()

LCASE()

LEFT()

LENGTH()

LIKE

LOCATE()

LOWER()

LPAD()

LTRIM()

MAKE_SET()

MID()

NOT LIKE

NOT REGEXP

OCT()

OCTET_LENGTH()

ORD()

POSITION()

QUOTE()

REGEXP

REGEXP_INSTR()

REGEXP_LIKE()

REGEXP_REPLACE()

REGEXP_SUBSTR()

REPEAT()

REPLACE()

REVERSE()

RIGHT()

RLIKE

RPAD()

RTRIM()

SPACE()

STRCMP()

SUBSTR()

SUBSTRING()

SUBSTRING_INDEX()

TO_BASE64()

TRANSLATE()

TRIM()

UCASE()

UNHEX()

UPPER()

WEIGHT_STRING()

サポートされていない関数

MySQLとの正規表現の互換性

構文の互換性

match_type互換性

データ型の互換性

その他の互換性

既知の問題

このページは役に立ちましたか？

`ASCII()`

`BIN()`

`BIT_LENGTH()`

`CHAR()`

`CHAR_LENGTH()`

`CHARACTER_LENGTH()`

`CONCAT()`

`CONCAT_WS()`

`ELT()`

`EXPORT_SET()`

`FIELD()`

`FIND_IN_SET()`

`FORMAT()`

`FROM_BASE64()`

`HEX()`

`INSERT()`

`INSTR()`

`LCASE()`

`LEFT()`

`LENGTH()`

`LIKE`

`LOCATE()`

`LOWER()`

`LPAD()`

`LTRIM()`

`MAKE_SET()`

`MID()`

`NOT LIKE`

`NOT REGEXP`

`OCT()`

`OCTET_LENGTH()`

`ORD()`

`POSITION()`

`QUOTE()`

`REGEXP`

`REGEXP_INSTR()`

`REGEXP_LIKE()`

`REGEXP_REPLACE()`

`REGEXP_SUBSTR()`

`REPEAT()`

`REPLACE()`

`REVERSE()`

`RIGHT()`

`RLIKE`

`RPAD()`

`RTRIM()`

`SPACE()`

`STRCMP()`

`SUBSTR()`

`SUBSTRING()`

`SUBSTRING_INDEX()`

`TO_BASE64()`

`TRANSLATE()`

`TRIM()`

`UCASE()`

`UNHEX()`

`UPPER()`

`WEIGHT_STRING()`

`match_type`互換性