Scientific Agent Skills:把科研工作流交给 AI Agent 的技能库

Scientific Agent Skills 是 K-Dense-AI 维护的开源 Agent Skills 集合,面向科研、工程、数据分析、金融和写作任务,把常见科学数据库、Python 包、分析流程和科研写作能力整理成可被 AI Agent 调用的技能。

K-Dense-AI/scientific-agent-skills 是一个面向科研和研究工作的 Agent Skills 集合。

它的定位不是再做一个聊天机器人,而是把科研里经常要查文档、连数据库、写分析脚本、处理文件、生成图表和整理报告的流程,拆成一组可以被 AI Agent 发现和调用的技能。

项目地址:https://github.com/K-Dense-AI/scientific-agent-skills

截至 2026-05-17 写作时,GitHub API 显示这个仓库约有 23.4k stars、2.5k forks,许可证为 MIT,最近一次推送时间是 2026-05-11。README 里写的是 135 个 ready-to-use scientific and research skills,不过仓库 scientific-skills 目录当前通过 GitHub API 能看到 137 个条目。这个差异可能来自统计口径、近期新增目录或 README 尚未同步更新。

先说结论

Scientific Agent Skills 适合已经在用 Codex、Claude Code、Cursor、Gemini CLI 或其他支持 Agent Skills 标准工具的人。

它的价值主要在三点:

  • 把科研工具链的使用方式写成 SKILL.md,让 agent 不必每次从零猜库怎么用。
  • 把常见科学数据库、Python 包、文档处理、科研写作和可视化流程整理到同一个技能集合里。
  • 让 AI Agent 更像一个能执行科研工作流的助手,而不只是回答概念问题。

但它也不是“装上就自动做科研”的魔法按钮。技能可以让 agent 更容易找到正确工具、生成更靠谱的代码和流程,但数据质量、实验设计、统计假设、临床或科研结论仍然需要人来判断。

它包含什么

README 把这个项目描述为一个覆盖科研、科学计算、工程、分析、金融和写作任务的技能集合。大类包括:

  • 生物信息学与基因组学
  • 化学信息学与药物发现
  • 蛋白质组学与质谱分析
  • 临床研究与精准医学
  • 医疗 AI 与临床机器学习
  • 医学影像与数字病理
  • 机器学习与 AI
  • 材料科学与化学
  • 物理与天文学
  • 工程仿真与优化
  • 数据分析与可视化
  • 地理空间科学与遥感
  • 实验室自动化
  • 科研写作、文献综述、同行评审和引用管理

这类技能的重点不是限制 agent 只能使用某些库。README 也明确说,agent 仍然可以自己写 Python、调用任意可用 API 或包;这些技能的作用是提前提供整理过的说明、示例、最佳实践和集成路径。

换句话说,它更像“科研工具说明书 + 工作流模板 + agent 调用约定”的集合。

数据库和 Python 包覆盖

项目里最吸引科研用户的部分,是数据库和 Python 科学生态的覆盖面。

README 提到:

  • 通过 database-lookup 统一访问 78 个公共数据库。
  • 覆盖 PubChem、ChEMBL、UniProt、COSMIC、ClinicalTrials.gov、FRED、USPTO 等数据库。
  • 额外包含 DepMap、Imaging Data Commons、PrimeKG、U.S. Treasury Fiscal Data、Hugging Science 等专门数据访问技能。
  • 提供 70+ 个优化过的 Python Package Skills。

从目录看,技能名里能看到很多熟悉工具:

  • rdkit
  • scanpy
  • biopython
  • bioservices
  • pydeseq2
  • scvelo
  • scvi-tools
  • pymatgen
  • qiskit
  • pennylane
  • openmm
  • mdanalysis
  • scikit-learn
  • statsmodels
  • matplotlib
  • seaborn
  • networkx
  • sympy
  • pytorch-lightning
  • transformers
  • timesfm-forecasting

对普通开发者来说,这些库本身不稀奇。真正有用的是:agent 在处理具体任务时,可以读到与该库相关的使用约束、代码样例、常见流程和注意事项。这样比只靠模型参数里的旧记忆更稳。

典型场景

Scientific Agent Skills 更适合多步骤科研任务,而不是单轮问答。

比如药物发现方向,可以让 agent 查询 ChEMBL 里的 EGFR 抑制剂,用 RDKit 分析结构活性关系,再用 DiffDock 做虚拟筛选,最后搜索文献并生成报告。

单细胞分析方向,可以把 10X 数据加载到 Scanpy,做质控、整合、细胞类型识别、差异表达和通路富集。

多组学方向,可以把 RNA-seq、质谱、代谢物、蛋白互作、临床试验和统计建模串起来。

这些任务如果完全靠手写 prompt,很容易变成“agent 知道大概方向,但每一步都要你提醒”。技能库的意义,就是把这类高频路径沉淀下来,让 agent 在执行时少走弯路。

安装方式

README 推荐的标准安装方式是使用 Agent Skills 工具:

1
npx skills add K-Dense-AI/scientific-agent-skills

如果使用 GitHub CLI,并且版本为 v2.90.0+,也可以通过 gh skill 安装:

1
gh skill install K-Dense-AI/scientific-agent-skills

安装某个具体技能:

1
gh skill install K-Dense-AI/scientific-agent-skills scanpy

指定目标 agent:

1
2
3
4
gh skill install K-Dense-AI/scientific-agent-skills --agent codex
gh skill install K-Dense-AI/scientific-agent-skills --agent cursor
gh skill install K-Dense-AI/scientific-agent-skills --agent claude-code
gh skill install K-Dense-AI/scientific-agent-skills --agent gemini

如果要保证可复现,可以 pin 到 release tag 或 commit SHA:

1
2
gh skill install K-Dense-AI/scientific-agent-skills --pin v1.0.0
gh skill install K-Dense-AI/scientific-agent-skills --pin abc123def

这点对科研环境很重要。科研分析里最怕“上周能跑、这周结果变了但不知道为什么”。如果技能参与了分析流程,最好把技能版本、依赖版本和数据版本一起记录。

运行环境要求

README 给出的基本要求包括:

  • Python 3.11+,推荐 3.12+
  • uv,用于安装 Python 依赖
  • 支持 Agent Skills 标准的客户端
  • macOS、Linux 或 Windows with WSL2

这里要注意 Windows 用户的实际体验。很多科学计算库在原生 Windows 下并不是不能用,但依赖链、编译工具、二进制包和路径问题更容易出意外。README 明确写 Windows with WSL2,也说明项目更偏向类 Unix 科研计算环境。

和普通 prompt 集合有什么区别

普通 prompt 集合通常只告诉模型“你应该怎么回答”。Scientific Agent Skills 更进一步:它把工具、库、数据库和流程写成 agent 可发现的技能。

这有几个实际差异:

  • 技能可以包含结构化说明和示例代码。
  • 技能可以围绕某个库或数据库长期维护。
  • agent 可以按任务选择相关技能,而不是一次性把所有规则塞进系统提示。
  • 团队可以只安装自己需要的技能,减少上下文噪音。
  • 技能可以跟随仓库版本管理、审计和更新。

对复杂科研任务来说,这种方式比“复制一大段万能提示词”更容易维护。模型会变,数据库会变,Python 包也会变。把这些变化沉淀在技能里,比散落在个人 prompt 文档里更可控。

安全和可信边界

这个项目的 README 把安全提醒写得很直接:Skills 可以执行代码,也会影响 coding agent 的行为。

这不是小事。科研技能可能会:

  • 安装 Python 依赖
  • 访问网络数据库
  • 读写本地文件
  • 运行分析脚本
  • 处理敏感实验数据或临床数据
  • 生成后续会被人引用的报告

因此不要无脑安装全部技能。更稳的做法是:

  1. 只安装当前任务需要的技能。
  2. 安装前阅读对应 SKILL.md
  3. 检查技能会调用哪些包、API、文件和外部服务。
  4. 对社区贡献的技能额外谨慎。
  5. 在隔离环境里运行涉及数据处理和代码执行的任务。
  6. 对科研结论、临床建议和统计结果保留人工复核。

README 还提到项目会使用 Cisco AI Defense Skill Scanner 做扫描,并建议用户也可以本地扫描第三方技能。扫描不能替代人工审查,但至少说明维护者意识到技能供应链风险。

适合谁

这个项目更适合这些人:

  • 已经在日常使用 AI coding agent。
  • 经常处理科研数据、论文、图表和报告。
  • 需要在 Python 科学生态里频繁切换工具。
  • 想让 agent 执行多步骤分析,而不是只回答概念。
  • 团队希望把科研流程沉淀成可复用技能。
  • 想研究 Agent Skills 标准如何落地到专业领域。

暂时不太适合这些场景:

  • 只是想让 AI 帮忙解释一篇论文。
  • 没有本地 Python 环境或不愿意处理依赖。
  • 对数据隐私、网络访问和代码执行边界还没有控制方案。
  • 需要严格合规的临床或生产决策系统,但没有人工审查和验证流程。

如果只是偶尔做一次分析,直接让 agent 写脚本可能更轻。如果你经常重复类似科研流程,技能库的价值会更明显。

使用建议

不要一开始就安装整个仓库,然后把所有任务都交给 agent。

更实际的路径是:

  1. 先选一个低风险任务,比如文献整理、图表生成或公开数据探索。
  2. 只安装相关技能,比如 literature-reviewscientific-writingscanpyrdkit
  3. 让 agent 先说明计划,再执行代码。
  4. 保留输入数据、脚本、环境和技能版本。
  5. 对输出结果做人工复查。
  6. 如果流程稳定,再把它写入团队自己的 SOP 或技能。

科研 agent 的关键不是“自动化一切”,而是把重复、繁琐、容易查错文档的部分交给工具,把判断、假设和结论留给人。

小结

Scientific Agent Skills 的意义,在于把 Agent Skills 从通用编程场景推进到科研场景。

科研工作天然是多工具、多数据库、多文件、多步骤的流程。单靠聊天式 prompt,很难稳定覆盖这些细节。这个项目把常见科学库、数据源和研究流程整理成技能,让 AI Agent 更容易进入真实科研工作流。

但它越强,也越需要边界感。技能会影响 agent 行为,也可能运行代码、联网和处理文件。安装前要看清楚技能内容,运行时要隔离环境,科研结论更不能跳过人工验证。

如果你已经在用 Codex、Claude Code、Cursor 或 Gemini CLI 做科研和数据分析,Scientific Agent Skills 值得认真看一眼。哪怕不直接全量安装,它的技能拆分方式也很适合作为团队整理科研 AI 工作流的参考。

参考链接:

记录并分享
使用 Hugo 构建
主题 StackJimmy 设计