集合演算
TiDB は、UNION、EXCEPT、および INTERSECT 演算子を使用した 3 つのセット演算をサポートします。セットの最小単位はSELECT
文です。
UNION演算子
数学では、2 つの集合 A と B の和集合は、A または B に含まれるすべての要素で構成されます。例:
SELECT 1 UNION SELECT 2;
+---+
| 1 |
+---+
| 2 |
| 1 |
+---+
2 rows in set (0.00 sec)
TiDB はUNION DISTINCT
とUNION ALL
両方の演算子をサポートしています。5 UNION DISTINCT
結果セットから重複レコードを削除し、 UNION ALL
重複レコードを含むすべてのレコードを保持します。TiDB ではデフォルトでUNION DISTINCT
使用されます。
CREATE TABLE t1 (a int);
CREATE TABLE t2 (a int);
INSERT INTO t1 VALUES (1),(2);
INSERT INTO t2 VALUES (1),(3);
クエリUNION DISTINCT
とUNION ALL
の例はそれぞれ次のようになります。
SELECT * FROM t1 UNION DISTINCT SELECT * FROM t2;
+---+
| a |
+---+
| 1 |
| 2 |
| 3 |
+---+
3 rows in set (0.00 sec)
SELECT * FROM t1 UNION ALL SELECT * FROM t2;
+---+
| a |
+---+
| 1 |
| 2 |
| 1 |
| 3 |
+---+
4 rows in set (0.00 sec)
EXCEPT演算子
A と B が 2 つのセットの場合、EXCEPT は、A にはあるが B にはない要素で構成される A と B の差セットを返します。
SELECT * FROM t1 EXCEPT SELECT * FROM t2;
+---+
| a |
+---+
| 2 |
+---+
1 rows in set (0.00 sec)
EXCEPT ALL
演算子はまだサポートされていません。
INTERSECT演算子
数学では、2 つの集合 A と B の交差は、A と B の両方に含まれるすべての要素で構成され、他の要素は含まれません。
SELECT * FROM t1 INTERSECT SELECT * FROM t2;
+---+
| a |
+---+
| 1 |
+---+
1 rows in set (0.00 sec)
INTERSECT ALL
演算子はまだサポートされていません。INTERSECT 演算子は、EXCEPT 演算子や UNION 演算子よりも優先されます。
SELECT * FROM t1 UNION ALL SELECT * FROM t1 INTERSECT SELECT * FROM t2;
+---+
| a |
+---+
| 1 |
| 1 |
| 2 |
+---+
3 rows in set (0.00 sec)
括弧
TiDB は、括弧を使用してセット演算の優先順位を指定することをサポートしています。括弧内の式が最初に処理されます。
(SELECT * FROM t1 UNION ALL SELECT * FROM t1) INTERSECT SELECT * FROM t2;
+---+
| a |
+---+
| 1 |
+---+
1 rows in set (0.00 sec)
ORDER BY
とLIMIT
使用する
TiDB は、セット操作の結果全体に対してORDER BY
またはLIMIT
句の使用をサポートします。これらの 2 つの句は、ステートメント全体の最後にある必要があります。
(SELECT * FROM t1 UNION ALL SELECT * FROM t1 INTERSECT SELECT * FROM t2) ORDER BY a LIMIT 2;
+---+
| a |
+---+
| 1 |
| 1 |
+---+
2 rows in set (0.00 sec)