再ランキング

再ランキングは、専用の再ランキングモデルを使用して検索結果を再評価および並べ替えることで、検索結果の関連性と精度を向上させるために使用される手法です。

検索プロセスは次の 2 つの段階で行われます。

初期検索: ベクトル検索により、コレクションから最も類似性の高い上位kドキュメントが識別されます。
再ランキング: 再ランキングモデルは、クエリとドキュメント間の関連性に基づいてこれらkドキュメントを評価し、それらを並べ替えて最終的な上位n結果 ( n ≤ k ) を生成します。

この 2 段階の検索アプローチにより、ドキュメントの関連性と精度の両方が大幅に向上します。

基本的な使い方

pytidbは、開発者が AI アプリケーションを効率的に構築できるように設計されています。

pytidb複数のサードパーティプロバイダーの再ランキングモデルを使用できるRerankerクラスを提供します。

再ランク付けインスタンスを作成します。

from pytidb.rerankers import Reranker

reranker = Reranker(model_name="{provider}/{model_name}")

.rerank()の方法を使用してリランカーを適用します。

table.search("{query}").rerank(reranker, "{field_to_rerank}").limit(3)

次の例は、サードパーティプロバイダーの再ランキングモデルを使用する方法を示しています。

Jina AI のリランカーを使用するには、 Webサイトにアクセスして API キーを作成します。

例えば：

jinaai = Reranker(
    # Using the `jina-reranker-m0` model
    model_name="jina_ai/jina-reranker-m0",
    api_key="{your-jinaai-api-key}"
)