ベクトル検索

ベクトル検索ドキュメント、画像、音声、動画など、多様なデータタイプを対象としたセマンティック類似検索を可能にします。MySQLの専門知識を活用することで、高度な検索機能を備えたスケーラブルなAIアプリケーションを構築できます。

始めましょう

TiDB ベクトル検索を開始するには、次のチュートリアルを参照してください。

自動埋め込み機能を使用すると、独自のベクターを用意することなく、プレーンテキストで直接ベクター検索を実行できます。この機能を使用すると、テキストデータを直接挿入し、テキストクエリを使用してセマンティック検索を実行できます。TiDBはバックグラウンドでテキストを自動的にベクターに変換します。

現在、TiDBはAmazon Titan、Cohere、Jina AI、OpenAI、Gemini、Hugging Face、NVIDIA NIMなど、様々な埋め込みモデルをサポートしています。ニーズに最適なモデルをお選びいただけます。詳細については、自動埋め込みの概要ご覧ください。

開発を加速させるために、TiDBベクトル検索を一般的なAIフレームワーク（LlamaIndexやLangChainなど）、埋め込みサービス（Jina AIなど）、ORMライブラリ（SQLAlchemy、Peewee、Django ORMなど）と統合できます。ニーズに最適なものを選択できます。

詳細についてはベクター検索統合の概要参照してください。

意味的類似性に重点を置くベクトル検索とは異なり、全文検索では正確なキーワードでドキュメントを取得できます。

RAG シナリオでの検索品質を向上させるには、ベクトル検索とフルテキスト検索を組み合わせることができます。

シナリオ	ドキュメント
SQL を使用してキーワードベースの検索を実行します。	SQLによる全文検索
Python アプリケーションで全文検索を実装します。	Pythonによる全文検索
より良い結果を得るために、ベクトル検索と全文検索を組み合わせます。	ハイブリッド検索

ベクター検索クエリのパフォーマンスを最適化するには、ベクターインデックスの追加、インデックス構築の進行状況の監視、ディメンションの削減、ベクター列の除外、インデックスのウォームアップなどの一連のベストプラクティスに従うことができます。

これらのベストプラクティスの詳細については、ベクトル検索のパフォーマンスを向上させる参照してください。

ベクトル検索を実装する前に、次の制限事項に注意してください。

完全なリストについては、ベクトル検索の制限参照してください。