📣

TiDB Cloud Premium はパブリックプレビュー中です。エンタープライズワークロード向けの無制限のスケーリング、即時の弾力性、高度なセキュリティを提供します。このページは自動翻訳されたものです。原文はこちらからご覧ください。

自動埋め込みの例

この例では、 pytidbクライアントで自動埋め込み機能を使用する方法を示します。

pytidbクライアントを使用してTiDBに接続します。
自動埋め込み用に構成されたVectorFieldを持つテーブルを定義します。
プレーンテキストデータを挿入してください。埋め込みデータはバックグラウンドで自動的に生成されます。
自然言語クエリを使用してベクトル検索を実行します。埋め込みベクトルは透過的に生成されます。

前提条件

始める前に、以下のものを用意してください。

Python (>=3.10) : Python 3.10以降のバージョンをインストールしてください。
TiDB Cloud Starterインスタンス: TiDB Cloudで無料のTiDB Cloud Starterインスタンスを作成できます。

実行方法

ステップ1. `pytidb`リポジトリをクローンする

git clone https://github.com/pingcap/pytidb.git
cd pytidb/examples/auto_embedding/

ステップ2. 必要なパッケージをインストールします

python -m venv .venv
source .venv/bin/activate
pip install -r reqs.txt

ステップ3．環境変数を設定する

TiDB Cloudコンソールで、私のTiDBページに移動し、ターゲットのTiDB Cloud Starterインスタンスの名前をクリックして、その概要ページに移動します。
右上隅の「接続」をクリックします。接続ダイアログが表示され、接続パラメータが表示されます。
接続パラメータに応じて環境変数を以下のように設定してください。

cat > .env <<EOF
TIDB_HOST={gateway-region}.prod.aws.tidbcloud.com
TIDB_PORT=4000
TIDB_USERNAME={prefix}.root
TIDB_PASSWORD={password}
TIDB_DATABASE=test

# Using TiDB Cloud Free embedding model by default, which does not require setting up any API key
EMBEDDING_PROVIDER=tidbcloud_free
EOF

ステップ4．デモを実行する

python main.py

期待される出力:

=== Define embedding function ===
Embedding function (model id: tidbcloud_free/amazon/titan-embed-text-v2) defined

=== Define table schema ===
Table created

=== Truncate table ===
Table truncated

=== Insert sample data ===
Inserted 3 chunks

=== Perform vector search ===
id: 1, text: TiDB is a distributed database that supports OLTP, OLAP, HTAP and AI workloads., distance: 0.30373281240458805
id: 2, text: PyTiDB is a Python library for developers to connect to TiDB., distance: 0.422506501973434
id: 3, text: LlamaIndex is a Python library for building AI-powered applications., distance: 0.5267239638442787

ソースコード： GitHubで見る

自動埋め込みの例

前提条件

実行方法

ステップ1. pytidbリポジトリをクローンする

ステップ2. 必要なパッケージをインストールします

ステップ3．環境変数を設定する

ステップ4．デモを実行する

関連リソース

このページは役に立ちましたか？

ステップ1. `pytidb`リポジトリをクローンする