OpenAI埋め込み
このドキュメントでは、TiDB Cloudの自動埋め込みで OpenAI 埋め込みモデルを使用して、テキスト クエリからセマンティック検索を実行する方法について説明します。
注記:
現在、 自動埋め込み次の AWS リージョンのTiDB Cloud Starter クラスターでのみ利用可能です。
Frankfurt (eu-central-1)
Oregon (us-west-2)
N. Virginia (us-east-1)
利用可能なモデル
ご自身のOpenAI APIキー(BYOK)をお持ちの場合は、 openai/
プレフィックスですべてのOpenAIモデルをご利用いただけます。例:
テキスト埋め込み 3 小
- 名前:
openai/text-embedding-3-small
- 寸法: 512-1536 (デフォルト: 1536)
- 距離メトリック: コサイン、L2
- 価格: OpenAIによる請求
- TiDB Cloudがホスト: ❌
- 鍵をご持参ください: ✅
テキスト埋め込み 3 大きい
- 名前:
openai/text-embedding-3-large
- 寸法: 256-3072 (デフォルト: 3072)
- 距離メトリック: コサイン、L2
- 価格: OpenAIによる請求
- TiDB Cloudがホスト: ❌
- 鍵をご持参ください: ✅
利用可能なモデルの完全なリストについては、 OpenAIドキュメント参照してください。
SQLの使用例
OpenAI モデルを使用するには、次のようにOpenAI APIキー指定する必要があります。
注記:
'your-openai-api-key-here'
実際の OpenAI API キーに置き換えます。
SET @@GLOBAL.TIDB_EXP_EMBED_OPENAI_API_KEY = 'your-openai-api-key-here';
CREATE TABLE sample (
`id` INT,
`content` TEXT,
`embedding` VECTOR(1536) GENERATED ALWAYS AS (EMBED_TEXT(
"openai/text-embedding-3-small",
`content`
)) STORED
);
INSERT INTO sample
(`id`, `content`)
VALUES
(1, "Java: Object-oriented language for cross-platform development."),
(2, "Java coffee: Bold Indonesian beans with low acidity."),
(3, "Java island: Densely populated, home to Jakarta."),
(4, "Java's syntax is used in Android apps."),
(5, "Dark roast Java beans enhance espresso blends.");
SELECT `id`, `content` FROM sample
ORDER BY
VEC_EMBED_COSINE_DISTANCE(
embedding,
"How to start learning Java programming?"
)
LIMIT 2;
結果:
+------+----------------------------------------------------------------+
| id | content |
+------+----------------------------------------------------------------+
| 1 | Java: Object-oriented language for cross-platform development. |
| 4 | Java's syntax is used in Android apps. |
+------+----------------------------------------------------------------+
オプション
OpenAIの埋め込みオプションすべて、 EMBED_TEXT()
関数のadditional_json_options
パラメータを介してサポートされます。
例: text-embedding-3-large に代替寸法を使用する
CREATE TABLE sample (
`id` INT,
`content` TEXT,
`embedding` VECTOR(1024) GENERATED ALWAYS AS (EMBED_TEXT(
"openai/text-embedding-3-large",
`content`,
'{"dimensions": 1024}'
)) STORED
);
利用可能なすべてのオプションについては、 OpenAIドキュメント参照してください。