OmicsClaw:记住你多组学数据的 AI 科研伙伴

2026/03/19

OmicsClaw 是什么?

OmicsClaw 是一个带持久记忆的多组学 AI 科研助手。不同于每次都从零开始的无状态工具,OmicsClaw 能跨会话记住你的数据集、分析历史和偏好。

覆盖 63+ 技能、6 大组学领域:空间转录组、单细胞、基因组、蛋白组、代谢组和 Bulk RNA-seq。支持 Telegram、飞书聊天或 CLI 使用。

为什么记忆很重要

传统工具OmicsClaw
每次重新上传数据记住文件路径和元数据
忘记分析历史追踪完整链路(预处理 → 聚类 → DE)
手动重复参数学习并应用你的偏好
仅命令行聊天界面 + CLI
无状态执行持久的科研伙伴

带记忆的对话示例:

第 1 次会话:
你:[上传 visium_brain.h5ad]
你:"预处理这个"
Bot:完成。[保存数据集 + 分析到记忆]

第 2 次会话(第二天):
你:"找空间 domain"
Bot:"使用你昨天的 Visium 脑组织数据(5000 spots,已归一化)"
     完成。[链接到上次分析]

快速开始

聊天界面(推荐)

git clone https://github.com/TianGzlab/OmicsClaw.git
cd OmicsClaw
pip install -e .
pip install -r bot/requirements.txt

# 配置
cp .env.example .env
# 编辑 .env:设置 LLM_API_KEY 和 Bot token

# 启动 Telegram Bot
python bot/telegram_bot.py

命令行

pip install -e .

# 试用 demo(无需数据)
python omicsclaw.py run spatial-preprocessing --demo

# 使用你的数据
python omicsclaw.py run spatial-preprocessing --input data.h5ad --output results/

安装级别

  • pip install -e . — 核心系统
  • pip install -e ".[spatial]" — 空间转录组
  • pip install -e ".[singlecell]" — 单细胞组学
  • pip install -e ".[genomics]" — 基因组学
  • pip install -e ".[full]" — 全部 63+ 技能

6 大组学领域

领域技能数核心能力
空间转录组15QC、聚类、细胞分型、反卷积、空间统计、细胞通信、速率
单细胞组学9预处理、doublet 检测、注释、轨迹、批次整合、GRN
基因组学10变异检测、比对、注释、结构变异、组装、CNV
蛋白组学8质谱 QC、肽段鉴定、定量、差异丰度、PTM 分析
代谢组学8峰检测、XCMS 预处理、注释、归一化、通路富集
Bulk RNA-seq13FASTQ QC、比对、DE、剪接、富集、反卷积、共表达、生存分析

示例:空间转录组流水线

# 1. 预处理:QC、归一化、聚类
python omicsclaw.py run spatial-preprocessing --input data.h5ad --output output/preprocess

# 2. 组织区域鉴定
python omicsclaw.py run spatial-domain-identification --input output/preprocess/processed.h5ad --output output/domains

# 3. 空间可变基因检测
python omicsclaw.py run spatial-svg-detection --input output/domains/processed.h5ad --output output/svg

# 4. 细胞间通信
python omicsclaw.py run spatial-cell-communication --input output/preprocess/processed.h5ad --output output/communication

智能路由

Orchestrator 自动将自然语言路由到正确的分析:

# 关键词模式(快速)
python omicsclaw.py run orchestrator --query "find spatially variable genes" --input data.h5ad --output output

# LLM 模式(语义理解)
python omicsclaw.py run orchestrator --query "我想了解哪些基因有空间表达模式" --routing-mode llm --output output

# 命名流水线
python omicsclaw.py run orchestrator --pipeline standard --input data.h5ad --output output

相关链接