数据获取 API
TrendPublish 的数据获取分成两类:
- URL 抓取:用户已经给出明确网页、RSS、X/Twitter 地址,系统负责读取正文。
- 关键词发现:用户给出
search:关键词,系统通过搜索、新闻、社区、论文源找到候选内容。
数据获取 API 都通过 fetchGroups 路由。分组内 provider 按顺序 fallback,先返回有效内容的 provider 会被采用。
免费或无需 Key 的来源
- GDELT:全球新闻线索,无需 API Key。适合补充媒体报道和事件背景。Provider 名称:
gdelt。 - Hacker News:技术社区线索,无需 API Key。适合 AI、开发者工具、开源项目热度判断。Provider 名称:
hackernews。 - arXiv:论文和研究线索,无需 API Key。适合模型、算法、评测和研究趋势。Provider 名称:
arxiv。 - RSS / RSSHub:明确订阅源抓取,无需商业 API Key。Provider 名称:
rss。
推荐免费搜索分组:
ts
fetchGroups: {
search: ["gdelt", "hackernews", "arxiv"],
}低成本或强能力来源
- Brave Search:独立搜索索引,成本低,适合作为通用 web search 第一层。Provider 名称:
brave-search,配置providers.fetch.brave.apiKey。 - Jina Search / Reader:搜索和网页正文读取都比较适合 AI 工作流。Provider 名称:
jina-search、jina,配置providers.fetch.jina.apiKey。 - Tavily:面向 AI Agent 的搜索 API,适合补充研究和 EvidencePack。Provider 名称:
tavily-search,配置providers.fetch.tavily.apiKey。 - Exa:语义搜索能力强,适合研究型选题和相似内容发现。Provider 名称:
exa-search,配置providers.fetch.exa.apiKey。 - Serper:Google SERP 风格结果,适合需要 Google 覆盖时使用。Provider 名称:
serper-search,配置providers.fetch.serper.apiKey。 - NewsAPI:新闻搜索源,适合新闻候选补充。Provider 名称:
newsapi,配置providers.fetch.newsapi.apiKey。
推荐增强搜索分组:
ts
fetchGroups: {
search: [
"brave-search",
"jina-search",
"tavily-search",
"exa-search",
"serper-search",
"gdelt",
"hackernews",
"arxiv",
],
}只把已经配置好 key 的付费 provider 放进分组。否则 doctor 会提示缺少对应凭证。
URL 抓取来源
- FireCrawl:普通网页正文抓取。Provider 名称:
firecrawl。 - Jina Reader:普通网页正文读取和正文深抓 fallback。Provider 名称:
jina。 - Twitter/X:X/Twitter 数据源。Provider 名称:
twitter。 - RSS / RSSHub:RSS 源。Provider 名称:
rss。
推荐网页抓取分组:
ts
fetchGroups: {
web: ["firecrawl", "jina"],
social: ["twitter"],
rss: ["rss"],
}官方入口
- Brave Search API: https://brave.com/search/api/
- Jina Reader/Search: https://jina.ai/reader/
- Tavily API: https://docs.tavily.com/
- Exa API: https://docs.exa.ai/
- Serper API: https://serper.dev/
- NewsAPI: https://newsapi.org/
- GDELT DOC API: https://blog.gdeltproject.org/gdelt-doc-2-0-api-debuts/
- Hacker News Search API: https://hn.algolia.com/api
- arXiv API: https://info.arxiv.org/help/api/