AI Agent 文献检索技能终极指南

2026/03/21

为什么文献检索技能如此重要

你有没有让 AI Agent 帮你"查找 CRISPR 递送机制的最新论文",然后收到一份看起来很自信、实际上全是编造的论文列表?引用幻觉是大语言模型最顽固的问题之一。

文献检索技能(Literature Search Skills)通过让 Agent 直接访问真实数据库来解决这个问题——PubMed、arXiv、OpenAlex、bioRxiv 等。Agent 不再凭空捏造参考文献,而是查询真实的 API,返回带 DOI、PMID 和链接的可验证结果。

我们调研了 7 个主要 Skill 仓库(K-Dense、FreedomIntelligence、ClawBio、ARIS、Imbad0202、Orchestra、VoltAgent),共找到 30+ 个与文献检索和学术研究相关的技能。本指南按使用场景逐一分析,帮你精准选择。


第一类:单数据库检索

这类技能将 Agent 连接到单一数据库,轻量、通常零配置,是大多数研究者的最佳起点。

技能所属仓库数据库需要 API Key适用场景
pubmed-databaseK-Dense (15.6K stars)PubMed (NCBI E-utilities)Boolean/MeSH 查询,BioPython 集成
pubmed-searchFreedomIntelligence (1.5K stars)PubMed (BioPython Entrez)快速关键词搜索,返回摘要
pubmed-summariserClawBio (476 stars)PubMed (NCBI Entrez)基因/疾病研究简报
arxiv-databaseK-DensearXiv (Atom API)按关键词、作者、ID、日期、分类检索
arxiv-searchFreedomIntelligencearXiv (Valyu API)需要 Valyu Key全 arXiv 语义搜索
/arxivARIS (2.9K stars)arXiv API下载 PDF 到本地论文库
biorxiv-databaseK-DensebioRxiv生命科学预印本
medrxiv-searchFreedomIntelligencemedRxiv (Valyu)需要 Valyu Key医学预印本语义搜索
openalex-databaseK-DenseOpenAlex (2.4 亿篇)否(免费)最大的开放学术数据库

如何选择?

  • 生物医学方向:选 pubmed-database(K-Dense),功能最全,支持 MeSH 术语。
  • 计算机/机器学习方向:选 arxiv-database(K-Dense),无需 API key,覆盖所有 arXiv 分类。
  • 全学科通用:选 openalex-database(K-Dense),2.4 亿篇论文,完全免费。
  • 快速简报:选 pubmed-summariser(ClawBio),专为"关于 X 基因最近有什么研究"这类问题设计。

安装示例:

clawhub install pubmed-database
clawhub install arxiv-database
clawhub install openalex-database

第二类:多源聚合检索

当单个数据库不够用时,这类技能同时搜索多个来源并汇总结果。

技能所属仓库覆盖数据源需要 API Key亮点
literature-searchFreedomIntelligencePubMed + arXiv + bioRxiv + medRxiv需要 Valyu Key四源同步语义搜索,结果聚合
biomedical-searchFreedomIntelligence上述 + ClinicalTrials.gov + FDA需要 Valyu Key加入临床试验和监管数据
medical-research-toolkitFreedomIntelligence14+ 数据库(ChEMBL、OpenTargets、OMIM、UniProt、KEGG...)需要 MCP 配置最全面的生物医学统一搜索
lit-synthesizerClawBioPubMed (MeSH) + bioRxiv + medRxiv引用图谱构建 + 研究空白分析

推荐

  • 最全面medical-research-toolkit(FreedomIntelligence),14 个数据库,但需要 MCP 配置。
  • 最佳性价比lit-synthesizer(ClawBio),不需要额外 API key,还能做引用图谱和 gap analysis。
  • 快速多源literature-search(FreedomIntelligence),四源同搜,但需要 Valyu key。

第三类:深度全文分析

超越标题和摘要——解析全文、提取结构化数据、生成系统综述。

技能所属仓库亮点需要 API Key
bgpt-paper-searchK-Dense / FreedomIntelligence全文索引,返回 25+ 结构化字段(方法、结果、样本量、质量分数)需要 BGPT MCP
literature-reviewK-Dense / FreedomIntelligence系统性综述,PRISMA 风格,多源交叉验证,APA/Nature 格式输出否(链接其他 skill)
/deep-researchImbad0202 (862 stars)13 个 Agent 协作,7 种模式(完整研究/快速简报/论文审查/系统综述/事实核查/苏格拉底对话/PRISMA + Meta 分析)
tooluniverse-literature-deep-researchFreedomIntelligence靶点消歧 + 证据分级 + 完整性清单 + 可测试假说生成需要 MCP 配置

推荐

  • 最深度/deep-research(Imbad0202),13 个 Agent 组成 PRISMA 流水线,支持 Meta 分析。注意:单次运行可能消耗 200K+ tokens。
  • 最结构化bgpt-paper-search(K-Dense),从全文提取 25+ 字段,适合证据合成。
  • 最实用literature-review(K-Dense),在深度和成本之间取得平衡,输出格式规范。

第四类:引用管理

没有什么比一条伪造的参考文献更能毁掉一篇论文。

技能所属仓库数据源亮点
citation-managementK-Dense / FreedomIntelligenceGoogle Scholar + PubMed + CrossRef + arXivDOI/PMID/arXiv ID 转 BibTeX,防止引用幻觉
abstract-searcherVoltAgent RegistryarXiv + Semantic Scholar + CrossRef自动为 .bib 文件补全摘要

第五类:新颖性检查

技能所属仓库亮点
/novelty-checkARIS提取 3-5 个核心声明,逐一独立检索,跨模型对抗审查

在投稿前特别有价值——让 Agent 帮你验证你的核心声明是否真的具有新颖性。


第六类:端到端研究流水线

这些技能将文献检索作为更大的自主研究工作流中的一个步骤。

技能所属仓库流程
autoresearchOrchestra (5.3K stars)文献调研 -> 选题 -> 实验 -> 论文写作,支持 overnight 运行
/idea-discoveryARIS文献 -> 创意 -> 查新 -> 评审 -> 迭代优化,全自主
/deep-research + /academic-pipelineImbad020210 阶段学术流水线:研究 -> 写作 -> 评审 -> 修改 -> 定稿

社区推荐仓库

除了主要仓库之外,这些社区项目提供了值得了解的专业技能。

AIPOCH Medical Research Skills(37 stars)

一套原创医学研究技能,覆盖循证医学全流程:搜索策略设计、数据库选择、证据级别优先排序、批判性评价和研究空白识别。

bash <(curl -s https://raw.githubusercontent.com/aipoch/medical-research-skills/main/scientific-skills/scripts/openclaw-install.sh)

OpenClaw Master Skills — LeoYeAI(1.96K stars)

每周更新的精选合集,包含 339+ 个技能。值得关注的条目:

  • academic-deep-research — 透明严谨的研究流程,非黑盒 API 包装
  • deep-research-pro — 多源深度研究 Agent,生成带引用的报告
clawhub install academic-deep-research

AMiner Open Skill — CanXiangCC

接入 AMiner 学术平台,提供 28 个 API,覆盖学者、论文、机构、期刊和专利。

  • aminer-data-search — 全功能版(需要 AMINER_API_KEY)
  • aminer-free-search — 免费版,适合发现和筛选

通用 Skill 库

技能所属仓库数据源需要 API Key说明
deep-research (Gemini)Antigravity (25K stars)Google Gemini Deep Research API需要 GEMINI_API_KEY$2-5/次,2-10 分钟,支持异步
exa-searchAntigravityExa API(语义搜索)需要 Exa Key有"research papers"专用分类
latex-paper-conversionAntigravity本地 pdflatex/bibtex学术论文格式互转(Springer、MDPI、IEEE、Nature 等)

编辑推荐

最佳入门(零配置)

openalex-database(K-Dense)

2.4 亿篇论文,完全免费,不需要任何 API key,覆盖全学科。如果今天只装一个技能,就装这个。

clawhub install openalex-database

最佳生物医学检索

lit-synthesizer(ClawBio)

用 MeSH 术语搜索 PubMed,同时覆盖 bioRxiv 和 medRxiv 预印本。不需要额外 API key。引用图谱和研究空白分析功能让它从纯搜索工具中脱颖而出。

最佳深度研究

/deep-research(Imbad0202)

13 个 Agent 组成的 PRISMA 流水线,支持 7 种模式,包括 Meta 分析。深度无出其右。预算 200K+ tokens/次。

最佳全链路

/idea-discovery(ARIS)

从文献检索到创意生成到新颖性检查到同行评审——全程自主。支持 overnight 运行,让 Agent 替你探索研究方向。


速查对比表

使用场景推荐技能需要 API KeyToken 消耗深度
快速 PubMed 搜索pubmed-database基础
CS/ML 论文搜索arxiv-database基础
全学科搜索openalex-database基础
多源生物医学lit-synthesizer中等中等
14 数据库生物医学medical-research-toolkit需要 MCP中等
系统综述/deep-research极高 (200K+)极高
完整研究流水线/idea-discovery端到端
引用管理citation-management工具
新颖性检查/novelty-check中等工具

注意事项

  1. API key 要求:部分技能(Valyu、BGPT MCP、OpenRouter)需要第三方 key,使用前务必确认。
  2. 重复技能:K-Dense 和 FreedomIntelligence 共享大量上游 skill,不要同时安装两个版本。
  3. Token 成本/deep-research(Imbad0202)单次运行可能消耗 200K+ tokens,做系统综述很强,日常查询太贵。
  4. 质量参差:VoltAgent Registry 的技能质量不一,优先使用 K-Dense / FreedomIntelligence / ClawBio 的经过整理的版本。

快速上手

从零到可用的最快路径:

# 1. 安装全学科通用检索
clawhub install openalex-database

# 2. 生物医学方向加装 PubMed
clawhub install pubmed-database

# 3. CS/ML 方向加装 arXiv
clawhub install arxiv-database

# 4. 加装引用管理,防止引用幻觉
clawhub install citation-management

安装完成后,直接用自然语言提问即可:"查找关于蛋白质折叠的 Transformer 架构最新论文"——Agent 会查询真实数据库,而不是凭空编造。


相关链接