集合演算
TiDB は、UNION、EXCEPT、INTERSECT 演算子を使用した 3 つの集合演算をサポートします。集合の最小単位はSELECT
ステートメントです。
UNION 演算子
数学では、2 つの集合 A と B の和集合は、A または B にあるすべての要素で構成されます。次に例を示します。
SELECT 1 UNION SELECT 2;
+---+
| 1 |
+---+
| 2 |
| 1 |
+---+
2 rows in set (0.00 sec)
TiDB はUNION DISTINCT
とUNION ALL
の両方の演算子をサポートします。 UNION DISTINCT
結果セットから重複レコードを削除しますが、 UNION ALL
重複を含むすべてのレコードを保持します。 TiDB ではデフォルトでUNION DISTINCT
が使用されます。
CREATE TABLE t1 (a int);
CREATE TABLE t2 (a int);
INSERT INTO t1 VALUES (1),(2);
INSERT INTO t2 VALUES (1),(3);
クエリUNION DISTINCT
とUNION ALL
の例はそれぞれ次のとおりです。
SELECT * FROM t1 UNION DISTINCT SELECT * FROM t2;
+---+
| a |
+---+
| 1 |
| 2 |
| 3 |
+---+
3 rows in set (0.00 sec)
SELECT * FROM t1 UNION ALL SELECT * FROM t2;
+---+
| a |
+---+
| 1 |
| 2 |
| 1 |
| 3 |
+---+
4 rows in set (0.00 sec)
EXCEPT 演算子
A と B が 2 つのセットの場合、EXCEPT は、A にはあるが B にはない要素で構成される A と B の差分セットを返します。
SELECT * FROM t1 EXCEPT SELECT * FROM t2;
+---+
| a |
+---+
| 2 |
+---+
1 rows in set (0.00 sec)
EXCEPT ALL
演算子はまだサポートされていません。
INTERSECT 演算子
数学では、2 つの集合 A と B の共通部分は、A と B の両方に含まれるすべての要素で構成され、他の要素は構成されません。
SELECT * FROM t1 INTERSECT SELECT * FROM t2;
+---+
| a |
+---+
| 1 |
+---+
1 rows in set (0.00 sec)
INTERSECT ALL
演算子はまだサポートされていません。 INTERSECT 演算子は、EXCEPT 演算子や UNION 演算子よりも優先されます。
SELECT * FROM t1 UNION ALL SELECT * FROM t1 INTERSECT SELECT * FROM t2;
+---+
| a |
+---+
| 1 |
| 1 |
| 2 |
+---+
3 rows in set (0.00 sec)
括弧
TiDB は、括弧を使用して集合演算の優先順位を指定することをサポートしています。括弧内の式が最初に処理されます。
(SELECT * FROM t1 UNION ALL SELECT * FROM t1) INTERSECT SELECT * FROM t2;
+---+
| a |
+---+
| 1 |
+---+
1 rows in set (0.00 sec)
ORDER BY
とLIMIT
を使用する
TiDB は、集合演算でのORDER BY
またはLIMIT
句の使用をサポートしています。これら 2 つの句はステートメント全体の最後になければなりません。
(SELECT * FROM t1 UNION ALL SELECT * FROM t1 INTERSECT SELECT * FROM t2) ORDER BY a LIMIT 2;
+---+
| a |
+---+
| 1 |
| 1 |
+---+
2 rows in set (0.00 sec)