Skip to content

Jina AI 集成指南

Jina 在本项目中用于抓取增强、深度检索、向量化与重排。

使用前提

.env 中设置:

bash
JINA_API_KEY="your_jina_api_key"

未设置时,相关模块会报 JINA_API_KEY environment variable is not set

涉及能力

  • Reader 抓取
  • DeepSearch 深度检索
  • Embedding 向量生成
  • Reranker 结果重排

代码位置

  • Reader: src/modules/scrapers/jina/jina.scraper.ts
  • DeepSearch: src/modules/scrapers/jina/jina.deepsearch.scraper.ts
  • Embedding: src/providers/embedding/jina/jina.embedding.ts
  • Reranker: src/providers/reranker/jina/jina.reranker.ts

典型使用场景

  1. 抓取网页正文时,优先走 Jina Reader。
  2. 搜索类问答场景,使用 DeepSearch 获取汇总答案和来源。
  3. 需要语义相关性排序时,先 Embedding 再 Reranker。

排查建议

报 401/403

  • 检查 JINA_API_KEY 是否正确、是否过期。

响应慢或超时

  • 缩小输入文本长度。
  • 降低并发。
  • 增加上游网络重试机制。

结果不理想

  • 优先改输入内容质量。
  • 按场景切换不同模型。
  • 在业务侧增加规则过滤,再交给模型处理。

参考

Released under the MIT License.