OmicsClaw 是什么?
OmicsClaw 是一个带持久记忆的多组学 AI 科研助手。不同于每次都从零开始的无状态工具,OmicsClaw 能跨会话记住你的数据集、分析历史和偏好。
覆盖 63+ 技能、6 大组学领域:空间转录组、单细胞、基因组、蛋白组、代谢组和 Bulk RNA-seq。支持 Telegram、飞书聊天或 CLI 使用。
为什么记忆很重要
| 传统工具 | OmicsClaw |
|---|---|
| 每次重新上传数据 | 记住文件路径和元数据 |
| 忘记分析历史 | 追踪完整链路(预处理 → 聚类 → DE) |
| 手动重复参数 | 学习并应用你的偏好 |
| 仅命令行 | 聊天界面 + CLI |
| 无状态执行 | 持久的科研伙伴 |
带记忆的对话示例:
第 1 次会话:
你:[上传 visium_brain.h5ad]
你:"预处理这个"
Bot:完成。[保存数据集 + 分析到记忆]
第 2 次会话(第二天):
你:"找空间 domain"
Bot:"使用你昨天的 Visium 脑组织数据(5000 spots,已归一化)"
完成。[链接到上次分析]快速开始
聊天界面(推荐)
git clone https://github.com/TianGzlab/OmicsClaw.git
cd OmicsClaw
pip install -e .
pip install -r bot/requirements.txt
# 配置
cp .env.example .env
# 编辑 .env:设置 LLM_API_KEY 和 Bot token
# 启动 Telegram Bot
python bot/telegram_bot.py命令行
pip install -e .
# 试用 demo(无需数据)
python omicsclaw.py run spatial-preprocessing --demo
# 使用你的数据
python omicsclaw.py run spatial-preprocessing --input data.h5ad --output results/安装级别
pip install -e .— 核心系统pip install -e ".[spatial]"— 空间转录组pip install -e ".[singlecell]"— 单细胞组学pip install -e ".[genomics]"— 基因组学pip install -e ".[full]"— 全部 63+ 技能
6 大组学领域
| 领域 | 技能数 | 核心能力 |
|---|---|---|
| 空间转录组 | 15 | QC、聚类、细胞分型、反卷积、空间统计、细胞通信、速率 |
| 单细胞组学 | 9 | 预处理、doublet 检测、注释、轨迹、批次整合、GRN |
| 基因组学 | 10 | 变异检测、比对、注释、结构变异、组装、CNV |
| 蛋白组学 | 8 | 质谱 QC、肽段鉴定、定量、差异丰度、PTM 分析 |
| 代谢组学 | 8 | 峰检测、XCMS 预处理、注释、归一化、通路富集 |
| Bulk RNA-seq | 13 | FASTQ QC、比对、DE、剪接、富集、反卷积、共表达、生存分析 |
示例:空间转录组流水线
# 1. 预处理:QC、归一化、聚类
python omicsclaw.py run spatial-preprocessing --input data.h5ad --output output/preprocess
# 2. 组织区域鉴定
python omicsclaw.py run spatial-domain-identification --input output/preprocess/processed.h5ad --output output/domains
# 3. 空间可变基因检测
python omicsclaw.py run spatial-svg-detection --input output/domains/processed.h5ad --output output/svg
# 4. 细胞间通信
python omicsclaw.py run spatial-cell-communication --input output/preprocess/processed.h5ad --output output/communication智能路由
Orchestrator 自动将自然语言路由到正确的分析:
# 关键词模式(快速)
python omicsclaw.py run orchestrator --query "find spatially variable genes" --input data.h5ad --output output
# LLM 模式(语义理解)
python omicsclaw.py run orchestrator --query "我想了解哪些基因有空间表达模式" --routing-mode llm --output output
# 命名流水线
python omicsclaw.py run orchestrator --pipeline standard --input data.h5ad --output output相关链接
- GitHub 仓库
- 记忆系统文档
- 安装指南
- Claw4Science — 探索更多面向科研的 OpenClaw 生态项目
