为什么文献检索技能如此重要
你有没有让 AI Agent 帮你"查找 CRISPR 递送机制的最新论文",然后收到一份看起来很自信、实际上全是编造的论文列表?引用幻觉是大语言模型最顽固的问题之一。
文献检索技能(Literature Search Skills)通过让 Agent 直接访问真实数据库来解决这个问题——PubMed、arXiv、OpenAlex、bioRxiv 等。Agent 不再凭空捏造参考文献,而是查询真实的 API,返回带 DOI、PMID 和链接的可验证结果。
我们调研了 7 个主要 Skill 仓库(K-Dense、FreedomIntelligence、ClawBio、ARIS、Imbad0202、Orchestra、VoltAgent),共找到 30+ 个与文献检索和学术研究相关的技能。本指南按使用场景逐一分析,帮你精准选择。
第一类:单数据库检索
这类技能将 Agent 连接到单一数据库,轻量、通常零配置,是大多数研究者的最佳起点。
| 技能 | 所属仓库 | 数据库 | 需要 API Key | 适用场景 |
|---|---|---|---|---|
pubmed-database | K-Dense (15.6K stars) | PubMed (NCBI E-utilities) | 否 | Boolean/MeSH 查询,BioPython 集成 |
pubmed-search | FreedomIntelligence (1.5K stars) | PubMed (BioPython Entrez) | 否 | 快速关键词搜索,返回摘要 |
pubmed-summariser | ClawBio (476 stars) | PubMed (NCBI Entrez) | 否 | 基因/疾病研究简报 |
arxiv-database | K-Dense | arXiv (Atom API) | 否 | 按关键词、作者、ID、日期、分类检索 |
arxiv-search | FreedomIntelligence | arXiv (Valyu API) | 需要 Valyu Key | 全 arXiv 语义搜索 |
/arxiv | ARIS (2.9K stars) | arXiv API | 否 | 下载 PDF 到本地论文库 |
biorxiv-database | K-Dense | bioRxiv | 否 | 生命科学预印本 |
medrxiv-search | FreedomIntelligence | medRxiv (Valyu) | 需要 Valyu Key | 医学预印本语义搜索 |
openalex-database | K-Dense | OpenAlex (2.4 亿篇) | 否(免费) | 最大的开放学术数据库 |
如何选择?
- 生物医学方向:选
pubmed-database(K-Dense),功能最全,支持 MeSH 术语。 - 计算机/机器学习方向:选
arxiv-database(K-Dense),无需 API key,覆盖所有 arXiv 分类。 - 全学科通用:选
openalex-database(K-Dense),2.4 亿篇论文,完全免费。 - 快速简报:选
pubmed-summariser(ClawBio),专为"关于 X 基因最近有什么研究"这类问题设计。
安装示例:
clawhub install pubmed-database
clawhub install arxiv-database
clawhub install openalex-database第二类:多源聚合检索
当单个数据库不够用时,这类技能同时搜索多个来源并汇总结果。
| 技能 | 所属仓库 | 覆盖数据源 | 需要 API Key | 亮点 |
|---|---|---|---|---|
literature-search | FreedomIntelligence | PubMed + arXiv + bioRxiv + medRxiv | 需要 Valyu Key | 四源同步语义搜索,结果聚合 |
biomedical-search | FreedomIntelligence | 上述 + ClinicalTrials.gov + FDA | 需要 Valyu Key | 加入临床试验和监管数据 |
medical-research-toolkit | FreedomIntelligence | 14+ 数据库(ChEMBL、OpenTargets、OMIM、UniProt、KEGG...) | 需要 MCP 配置 | 最全面的生物医学统一搜索 |
lit-synthesizer | ClawBio | PubMed (MeSH) + bioRxiv + medRxiv | 否 | 引用图谱构建 + 研究空白分析 |
推荐
- 最全面:
medical-research-toolkit(FreedomIntelligence),14 个数据库,但需要 MCP 配置。 - 最佳性价比:
lit-synthesizer(ClawBio),不需要额外 API key,还能做引用图谱和 gap analysis。 - 快速多源:
literature-search(FreedomIntelligence),四源同搜,但需要 Valyu key。
第三类:深度全文分析
超越标题和摘要——解析全文、提取结构化数据、生成系统综述。
| 技能 | 所属仓库 | 亮点 | 需要 API Key |
|---|---|---|---|
bgpt-paper-search | K-Dense / FreedomIntelligence | 全文索引,返回 25+ 结构化字段(方法、结果、样本量、质量分数) | 需要 BGPT MCP |
literature-review | K-Dense / FreedomIntelligence | 系统性综述,PRISMA 风格,多源交叉验证,APA/Nature 格式输出 | 否(链接其他 skill) |
/deep-research | Imbad0202 (862 stars) | 13 个 Agent 协作,7 种模式(完整研究/快速简报/论文审查/系统综述/事实核查/苏格拉底对话/PRISMA + Meta 分析) | 否 |
tooluniverse-literature-deep-research | FreedomIntelligence | 靶点消歧 + 证据分级 + 完整性清单 + 可测试假说生成 | 需要 MCP 配置 |
推荐
- 最深度:
/deep-research(Imbad0202),13 个 Agent 组成 PRISMA 流水线,支持 Meta 分析。注意:单次运行可能消耗 200K+ tokens。 - 最结构化:
bgpt-paper-search(K-Dense),从全文提取 25+ 字段,适合证据合成。 - 最实用:
literature-review(K-Dense),在深度和成本之间取得平衡,输出格式规范。
第四类:引用管理
没有什么比一条伪造的参考文献更能毁掉一篇论文。
| 技能 | 所属仓库 | 数据源 | 亮点 |
|---|---|---|---|
citation-management | K-Dense / FreedomIntelligence | Google Scholar + PubMed + CrossRef + arXiv | DOI/PMID/arXiv ID 转 BibTeX,防止引用幻觉 |
abstract-searcher | VoltAgent Registry | arXiv + Semantic Scholar + CrossRef | 自动为 .bib 文件补全摘要 |
第五类:新颖性检查
| 技能 | 所属仓库 | 亮点 |
|---|---|---|
/novelty-check | ARIS | 提取 3-5 个核心声明,逐一独立检索,跨模型对抗审查 |
在投稿前特别有价值——让 Agent 帮你验证你的核心声明是否真的具有新颖性。
第六类:端到端研究流水线
这些技能将文献检索作为更大的自主研究工作流中的一个步骤。
| 技能 | 所属仓库 | 流程 |
|---|---|---|
autoresearch | Orchestra (5.3K stars) | 文献调研 -> 选题 -> 实验 -> 论文写作,支持 overnight 运行 |
/idea-discovery | ARIS | 文献 -> 创意 -> 查新 -> 评审 -> 迭代优化,全自主 |
/deep-research + /academic-pipeline | Imbad0202 | 10 阶段学术流水线:研究 -> 写作 -> 评审 -> 修改 -> 定稿 |
社区推荐仓库
除了主要仓库之外,这些社区项目提供了值得了解的专业技能。
AIPOCH Medical Research Skills(37 stars)
一套原创医学研究技能,覆盖循证医学全流程:搜索策略设计、数据库选择、证据级别优先排序、批判性评价和研究空白识别。
bash <(curl -s https://raw.githubusercontent.com/aipoch/medical-research-skills/main/scientific-skills/scripts/openclaw-install.sh)OpenClaw Master Skills — LeoYeAI(1.96K stars)
每周更新的精选合集,包含 339+ 个技能。值得关注的条目:
academic-deep-research— 透明严谨的研究流程,非黑盒 API 包装deep-research-pro— 多源深度研究 Agent,生成带引用的报告
clawhub install academic-deep-researchAMiner Open Skill — CanXiangCC
接入 AMiner 学术平台,提供 28 个 API,覆盖学者、论文、机构、期刊和专利。
aminer-data-search— 全功能版(需要 AMINER_API_KEY)aminer-free-search— 免费版,适合发现和筛选
通用 Skill 库
| 技能 | 所属仓库 | 数据源 | 需要 API Key | 说明 |
|---|---|---|---|---|
deep-research (Gemini) | Antigravity (25K stars) | Google Gemini Deep Research API | 需要 GEMINI_API_KEY | $2-5/次,2-10 分钟,支持异步 |
exa-search | Antigravity | Exa API(语义搜索) | 需要 Exa Key | 有"research papers"专用分类 |
latex-paper-conversion | Antigravity | 本地 pdflatex/bibtex | 否 | 学术论文格式互转(Springer、MDPI、IEEE、Nature 等) |
编辑推荐
最佳入门(零配置)
openalex-database(K-Dense)
2.4 亿篇论文,完全免费,不需要任何 API key,覆盖全学科。如果今天只装一个技能,就装这个。
clawhub install openalex-database最佳生物医学检索
lit-synthesizer(ClawBio)
用 MeSH 术语搜索 PubMed,同时覆盖 bioRxiv 和 medRxiv 预印本。不需要额外 API key。引用图谱和研究空白分析功能让它从纯搜索工具中脱颖而出。
最佳深度研究
/deep-research(Imbad0202)
13 个 Agent 组成的 PRISMA 流水线,支持 7 种模式,包括 Meta 分析。深度无出其右。预算 200K+ tokens/次。
最佳全链路
/idea-discovery(ARIS)
从文献检索到创意生成到新颖性检查到同行评审——全程自主。支持 overnight 运行,让 Agent 替你探索研究方向。
速查对比表
| 使用场景 | 推荐技能 | 需要 API Key | Token 消耗 | 深度 |
|---|---|---|---|---|
| 快速 PubMed 搜索 | pubmed-database | 否 | 低 | 基础 |
| CS/ML 论文搜索 | arxiv-database | 否 | 低 | 基础 |
| 全学科搜索 | openalex-database | 否 | 低 | 基础 |
| 多源生物医学 | lit-synthesizer | 否 | 中等 | 中等 |
| 14 数据库生物医学 | medical-research-toolkit | 需要 MCP | 中等 | 高 |
| 系统综述 | /deep-research | 否 | 极高 (200K+) | 极高 |
| 完整研究流水线 | /idea-discovery | 否 | 高 | 端到端 |
| 引用管理 | citation-management | 否 | 低 | 工具 |
| 新颖性检查 | /novelty-check | 否 | 中等 | 工具 |
注意事项
- API key 要求:部分技能(Valyu、BGPT MCP、OpenRouter)需要第三方 key,使用前务必确认。
- 重复技能:K-Dense 和 FreedomIntelligence 共享大量上游 skill,不要同时安装两个版本。
- Token 成本:
/deep-research(Imbad0202)单次运行可能消耗 200K+ tokens,做系统综述很强,日常查询太贵。 - 质量参差:VoltAgent Registry 的技能质量不一,优先使用 K-Dense / FreedomIntelligence / ClawBio 的经过整理的版本。
快速上手
从零到可用的最快路径:
# 1. 安装全学科通用检索
clawhub install openalex-database
# 2. 生物医学方向加装 PubMed
clawhub install pubmed-database
# 3. CS/ML 方向加装 arXiv
clawhub install arxiv-database
# 4. 加装引用管理,防止引用幻觉
clawhub install citation-management安装完成后,直接用自然语言提问即可:"查找关于蛋白质折叠的 Transformer 架构最新论文"——Agent 会查询真实数据库,而不是凭空编造。
相关链接
- OpenClaw 生态
- K-Dense Registry
- ClawBio
- ARIS Skills
- Claw4Science — 探索更多面向科学的 OpenClaw 生态项目
