📣
TiDB Cloud Essential 开放公测中。此页面由 AI 自动翻译,英文原文请见此处。

RAG 示例



本示例演示如何使用 pytidb(TiDB 官方 Python SDK)构建一个最小化的 RAG 应用。

该应用使用 Ollama 进行本地嵌入生成,使用 Streamlit 构建 Web UI,并通过 pytidb 搭建 RAG 流水线。

RAG application built with PyTiDB

基于 PyTiDB 构建的 RAG 应用

前置条件

在开始之前,请确保你已具备以下条件:

  • Python (>=3.10):安装 Python 3.10 或以上版本。
  • TiDB Cloud Starter 集群:你可以在 TiDB Cloud 上创建一个免费的 TiDB 集群。
  • Ollama:从 Ollama 安装。

运行方法

步骤 1. 准备推理 API

使用 Ollama CLI 拉取 embedding 和 LLM 镜像:

ollama pull mxbai-embed-large ollama pull gemma3:4b ollama run gemma3:4b

验证 /embed/generate 接口是否已启动:

curl http://localhost:11434/api/embed -d '{ "model": "mxbai-embed-large", "input": "Llamas are members of the camelid family" }'
curl http://localhost:11434/api/generate -d '{ "model": "gemma3:4b", "prompt": "Hello, Who are you?" }'

步骤 2. 克隆仓库

git clone https://github.com/pingcap/pytidb.git cd pytidb/examples/rag/

步骤 3. 安装所需依赖并设置环境

python -m venv .venv source .venv/bin/activate pip install -r reqs.txt

步骤 4. 设置环境变量

  1. TiDB Cloud 控制台中,进入 Clusters 页面,然后点击目标集群名称,进入其概览页面。
  2. 点击右上角的 Connect。此时会弹出连接对话框,显示连接参数。
  3. 根据连接参数设置环境变量,如下所示:
cat > .env <<EOF TIDB_HOST={gateway-region}.prod.aws.tidbcloud.com TIDB_PORT=4000 TIDB_USERNAME={prefix}.root TIDB_PASSWORD={password} TIDB_DATABASE=test EOF

步骤 5. 运行 Streamlit 应用

streamlit run main.py

打开浏览器并访问 http://localhost:8501

故障排查

502 Bad Gateway 错误

尝试关闭你的全局代理设置。

相关资源

文档内容是否有帮助?