ジェミニ埋め込み
このドキュメントでは、TiDB Cloudの自動埋め込みで Gemini 埋め込みモデルを使用して、テキスト クエリからセマンティック検索を実行する方法について説明します。
注記:
現在、 自動埋め込み次の AWS リージョンのTiDB Cloud Starter クラスターでのみ利用可能です。
Frankfurt (eu-central-1)
Oregon (us-west-2)
N. Virginia (us-east-1)
利用可能なモデル
ご自身のGemini APIキー(BYOK)をお持ちいただければ、すべてのGeminiモデルをgemini/
プレフィックスでご利用いただけます。例:
ジェミニ埋め込み-001
- 名前:
gemini/gemini-embedding-001
- 寸法: 128~3072 (デフォルト: 3072)
- 距離メトリック: コサイン、L2
- 最大入力テキストトークン数: 2,048
- 価格: Google が請求
- TiDB Cloudがホスト: ❌
- 鍵をご持参ください: ✅
利用可能なモデルの完全なリストについては、 Gemini ドキュメント参照してください。
SQLの使用例
Gemini モデルを使用するには、次のようにGemini APIキー指定する必要があります。
注記:
'your-gemini-api-key-here'
実際の Gemini API キーに置き換えます。
SET @@GLOBAL.TIDB_EXP_EMBED_GEMINI_API_KEY = 'your-gemini-api-key-here';
CREATE TABLE sample (
`id` INT,
`content` TEXT,
`embedding` VECTOR(3072) GENERATED ALWAYS AS (EMBED_TEXT(
"gemini/gemini-embedding-001",
`content`
)) STORED
);
INSERT INTO sample
(`id`, `content`)
VALUES
(1, "Java: Object-oriented language for cross-platform development."),
(2, "Java coffee: Bold Indonesian beans with low acidity."),
(3, "Java island: Densely populated, home to Jakarta."),
(4, "Java's syntax is used in Android apps."),
(5, "Dark roast Java beans enhance espresso blends.");
SELECT `id`, `content` FROM sample
ORDER BY
VEC_EMBED_COSINE_DISTANCE(
embedding,
"How to start learning Java programming?"
)
LIMIT 2;
結果:
+------+----------------------------------------------------------------+
| id | content |
+------+----------------------------------------------------------------+
| 1 | Java: Object-oriented language for cross-platform development. |
| 4 | Java's syntax is used in Android apps. |
+------+----------------------------------------------------------------+
オプション
ジェミニオプションすべて、 EMBED_TEXT()
関数のadditional_json_options
パラメータを介してサポートされます。
例: 品質を向上させるためにタスクの種類を指定する
CREATE TABLE sample (
`id` INT,
`content` TEXT,
`embedding` VECTOR(1024) GENERATED ALWAYS AS (EMBED_TEXT(
"gemini/gemini-embedding-001",
`content`,
'{"task_type": "SEMANTIC_SIMILARITY"}'
)) STORED
);
例: 代替ディメンションを使用する
CREATE TABLE sample (
`id` INT,
`content` TEXT,
`embedding` VECTOR(768) GENERATED ALWAYS AS (EMBED_TEXT(
"gemini/gemini-embedding-001",
`content`,
'{"output_dimensionality": 768}'
)) STORED
);
利用可能なすべてのオプションについては、 Gemini ドキュメント参照してください。