Scientific Agent Skills:把科研工作流交給 AI Agent 的技能庫

Scientific Agent Skills 是 K-Dense-AI 維護的開源 Agent Skills 集合,面向科研、工程、資料分析、金融和寫作任務,把常見科學資料庫、Python 套件、分析流程和科研寫作能力整理成可被 AI Agent 調用的技能。

K-Dense-AI/scientific-agent-skills 是一個面向科研和研究工作的 Agent Skills 集合。

它的定位不是再做一個聊天機器人,而是把科研裡經常要查文件、連資料庫、寫分析腳本、處理檔案、生成圖表和整理報告的流程,拆成一組可以被 AI Agent 發現和調用的技能。

專案地址:https://github.com/K-Dense-AI/scientific-agent-skills

截至 2026-05-17 寫作時,GitHub API 顯示這個倉庫約有 23.4k stars、2.5k forks,許可證為 MIT,最近一次推送時間是 2026-05-11。README 裡寫的是 135 個 ready-to-use scientific and research skills,不過倉庫 scientific-skills 目錄目前透過 GitHub API 能看到 137 個條目。這個差異可能來自統計口徑、近期新增目錄或 README 尚未同步更新。

先說結論

Scientific Agent Skills 適合已經在用 Codex、Claude Code、Cursor、Gemini CLI 或其他支援 Agent Skills 標準工具的人。

它的價值主要在三點:

  • 把科研工具鏈的使用方式寫成 SKILL.md,讓 agent 不必每次從零猜庫怎麼用。
  • 把常見科學資料庫、Python 套件、文件處理、科研寫作和視覺化流程整理到同一個技能集合裡。
  • 讓 AI Agent 更像一個能執行科研工作流的助手,而不只是回答概念問題。

但它也不是「裝上就自動做科研」的魔法按鈕。技能可以讓 agent 更容易找到正確工具、生成更可靠的程式碼和流程,但資料品質、實驗設計、統計假設、臨床或科研結論仍然需要人來判斷。

它包含什麼

README 把這個專案描述為一個覆蓋科研、科學計算、工程、分析、金融和寫作任務的技能集合。大類包括:

  • 生物資訊學與基因組學
  • 化學資訊學與藥物發現
  • 蛋白質組學與質譜分析
  • 臨床研究與精準醫學
  • 醫療 AI 與臨床機器學習
  • 醫學影像與數位病理
  • 機器學習與 AI
  • 材料科學與化學
  • 物理與天文學
  • 工程模擬與最佳化
  • 資料分析與視覺化
  • 地理空間科學與遙感
  • 實驗室自動化
  • 科研寫作、文獻綜述、同行評審和引用管理

這類技能的重點不是限制 agent 只能使用某些庫。README 也明確說,agent 仍然可以自己寫 Python、調用任意可用 API 或套件;這些技能的作用是提前提供整理過的說明、範例、最佳實踐和整合路徑。

換句話說,它更像「科研工具說明書 + 工作流模板 + agent 調用約定」的集合。

資料庫和 Python 套件覆蓋

專案裡最吸引科研使用者的部分,是資料庫和 Python 科學生態的覆蓋面。

README 提到:

  • 透過 database-lookup 統一存取 78 個公共資料庫。
  • 覆蓋 PubChem、ChEMBL、UniProt、COSMIC、ClinicalTrials.gov、FRED、USPTO 等資料庫。
  • 額外包含 DepMap、Imaging Data Commons、PrimeKG、U.S. Treasury Fiscal Data、Hugging Science 等專門資料存取技能。
  • 提供 70+ 個最佳化過的 Python Package Skills。

從目錄看,技能名裡能看到很多熟悉工具:

  • rdkit
  • scanpy
  • biopython
  • bioservices
  • pydeseq2
  • scvelo
  • scvi-tools
  • pymatgen
  • qiskit
  • pennylane
  • openmm
  • mdanalysis
  • scikit-learn
  • statsmodels
  • matplotlib
  • seaborn
  • networkx
  • sympy
  • pytorch-lightning
  • transformers
  • timesfm-forecasting

對普通開發者來說,這些庫本身不稀奇。真正有用的是:agent 在處理具體任務時,可以讀到與該庫相關的使用約束、程式碼範例、常見流程和注意事項。這比只靠模型參數裡的舊記憶更穩。

典型場景

Scientific Agent Skills 更適合多步驟科研任務,而不是單輪問答。

例如藥物發現方向,可以讓 agent 查詢 ChEMBL 裡的 EGFR 抑制劑,用 RDKit 分析結構活性關係,再用 DiffDock 做虛擬篩選,最後搜尋文獻並生成報告。

單細胞分析方向,可以把 10X 資料載入 Scanpy,做質控、整合、細胞類型識別、差異表達和通路富集。

多組學方向,可以把 RNA-seq、質譜、代謝物、蛋白互作、臨床試驗和統計建模串起來。

這些任務如果完全靠手寫 prompt,很容易變成「agent 知道大概方向,但每一步都要你提醒」。技能庫的意義,就是把這類高頻路徑沉澱下來,讓 agent 在執行時少走彎路。

安裝方式

README 推薦的標準安裝方式是使用 Agent Skills 工具:

1
npx skills add K-Dense-AI/scientific-agent-skills

如果使用 GitHub CLI,且版本為 v2.90.0+,也可以透過 gh skill 安裝:

1
gh skill install K-Dense-AI/scientific-agent-skills

安裝某個具體技能:

1
gh skill install K-Dense-AI/scientific-agent-skills scanpy

指定目標 agent:

1
2
3
4
gh skill install K-Dense-AI/scientific-agent-skills --agent codex
gh skill install K-Dense-AI/scientific-agent-skills --agent cursor
gh skill install K-Dense-AI/scientific-agent-skills --agent claude-code
gh skill install K-Dense-AI/scientific-agent-skills --agent gemini

如果要保證可重現,可以 pin 到 release tag 或 commit SHA:

1
2
gh skill install K-Dense-AI/scientific-agent-skills --pin v1.0.0
gh skill install K-Dense-AI/scientific-agent-skills --pin abc123def

這點對科研環境很重要。科研分析裡最怕「上週能跑、這週結果變了但不知道為什麼」。如果技能參與了分析流程,最好把技能版本、依賴版本和資料版本一起記錄。

執行環境要求

README 給出的基本要求包括:

  • Python 3.11+,推薦 3.12+
  • uv,用於安裝 Python 依賴
  • 支援 Agent Skills 標準的客戶端
  • macOS、Linux 或 Windows with WSL2

這裡要注意 Windows 使用者的實際體驗。很多科學計算庫在原生 Windows 下不是不能用,但依賴鏈、編譯工具、二進位套件和路徑問題更容易出意外。README 明確寫 Windows with WSL2,也說明專案更偏向類 Unix 科研計算環境。

和普通 prompt 集合有什麼區別

普通 prompt 集合通常只告訴模型「你應該怎麼回答」。Scientific Agent Skills 更進一步:它把工具、庫、資料庫和流程寫成 agent 可發現的技能。

這有幾個實際差異:

  • 技能可以包含結構化說明和範例程式碼。
  • 技能可以圍繞某個庫或資料庫長期維護。
  • agent 可以按任務選擇相關技能,而不是一次性把所有規則塞進系統提示。
  • 團隊可以只安裝自己需要的技能,減少上下文噪音。
  • 技能可以跟隨倉庫版本管理、審計和更新。

對複雜科研任務來說,這種方式比「複製一大段萬能提示詞」更容易維護。模型會變,資料庫會變,Python 套件也會變。把這些變化沉澱在技能裡,比散落在個人 prompt 文件裡更可控。

安全和可信邊界

這個專案的 README 把安全提醒寫得很直接:Skills 可以執行程式碼,也會影響 coding agent 的行為。

這不是小事。科研技能可能會:

  • 安裝 Python 依賴。
  • 存取網路資料庫。
  • 讀寫本地檔案。
  • 執行分析腳本。
  • 處理敏感實驗資料或臨床資料。
  • 生成後續會被人引用的報告。

因此不要無腦安裝全部技能。更穩的做法是:

  1. 只安裝目前任務需要的技能。
  2. 安裝前閱讀對應 SKILL.md
  3. 檢查技能會調用哪些套件、API、檔案和外部服務。
  4. 對社群貢獻的技能額外謹慎。
  5. 在隔離環境裡執行涉及資料處理和程式碼執行的任務。
  6. 對科研結論、臨床建議和統計結果保留人工複核。

README 還提到專案會使用 Cisco AI Defense Skill Scanner 做掃描,並建議使用者也可以本地掃描第三方技能。掃描不能替代人工審查,但至少說明維護者意識到技能供應鏈風險。

適合誰

這個專案更適合這些人:

  • 已經在日常使用 AI coding agent。
  • 經常處理科研資料、論文、圖表和報告。
  • 需要在 Python 科學生態裡頻繁切換工具。
  • 想讓 agent 執行多步驟分析,而不是只回答概念。
  • 團隊希望把科研流程沉澱成可複用技能。
  • 想研究 Agent Skills 標準如何落地到專業領域。

暫時不太適合這些場景:

  • 只是想讓 AI 幫忙解釋一篇論文。
  • 沒有本地 Python 環境或不願意處理依賴。
  • 對資料隱私、網路存取和程式碼執行邊界還沒有控制方案。
  • 需要嚴格合規的臨床或生產決策系統,但沒有人工審查和驗證流程。

如果只是偶爾做一次分析,直接讓 agent 寫腳本可能更輕。如果你經常重複類似科研流程,技能庫的價值會更明顯。

使用建議

不要一開始就安裝整個倉庫,然後把所有任務都交給 agent。

更實際的路徑是:

  1. 先選一個低風險任務,例如文獻整理、圖表生成或公開資料探索。
  2. 只安裝相關技能,例如 literature-reviewscientific-writingscanpyrdkit
  3. 讓 agent 先說明計畫,再執行程式碼。
  4. 保留輸入資料、腳本、環境和技能版本。
  5. 對輸出結果做人工複查。
  6. 如果流程穩定,再把它寫入團隊自己的 SOP 或技能。

科研 agent 的關鍵不是「自動化一切」,而是把重複、繁瑣、容易查錯文件的部分交給工具,把判斷、假設和結論留給人。

小結

Scientific Agent Skills 的意義,在於把 Agent Skills 從通用編程場景推進到科研場景。

科研工作天然是多工具、多資料庫、多檔案、多步驟的流程。單靠聊天式 prompt,很難穩定覆蓋這些細節。這個專案把常見科學庫、資料源和研究流程整理成技能,讓 AI Agent 更容易進入真實科研工作流。

但它越強,也越需要邊界感。技能會影響 agent 行為,也可能執行程式碼、聯網和處理檔案。安裝前要看清楚技能內容,執行時要隔離環境,科研結論更不能跳過人工驗證。

如果你已經在用 Codex、Claude Code、Cursor 或 Gemini CLI 做科研和資料分析,Scientific Agent Skills 值得認真看一眼。即使不直接全量安裝,它的技能拆分方式也很適合作為團隊整理科研 AI 工作流的參考。

參考連結:

记录并分享
使用 Hugo 建立
主題 StackJimmy 設計