Scientific Agent Skills: una biblioteca de skills para dar flujos de investigación a AI Agents

K-Dense-AI/scientific-agent-skills es una colección de Agent Skills para trabajo científico y de investigación.

Su objetivo no es crear otro chatbot. Convierte tareas frecuentes de investigación, como consultar documentación, conectar bases de datos, escribir scripts de análisis, procesar archivos, generar gráficos y preparar informes, en skills que un AI Agent puede descubrir y llamar.

Proyecto: https://github.com/K-Dense-AI/scientific-agent-skills

A fecha de 2026-05-17, la API de GitHub mostraba unos 23.4k stars, 2.5k forks, licencia MIT y último push el 2026-05-11. El README habla de 135 ready-to-use scientific and research skills, pero el directorio scientific-skills muestra 137 entradas vía API de GitHub. La diferencia puede venir del criterio de conteo, entradas recientes o retraso en actualizar el README.

Conclusión rápida

Scientific Agent Skills encaja con quienes ya usan Codex, Claude Code, Cursor, Gemini CLI u otra herramienta compatible con el estándar Agent Skills.

Su valor principal está en tres puntos:

Escribe el uso de herramientas científicas en SKILL.md, para que el agent no tenga que adivinar cada vez cómo se usa una librería.
Organiza bases de datos científicas, paquetes Python, procesamiento de documentos, escritura científica y visualización en una misma colección.
Hace que un AI Agent se parezca más a un asistente capaz de ejecutar flujos de investigación, no solo a un bot que responde conceptos.

Pero no es un botón mágico que “hace ciencia” al instalarlo. Las skills pueden ayudar al agent a elegir herramientas correctas y generar código y flujos más fiables, pero la calidad de datos, el diseño experimental, las hipótesis estadísticas, las decisiones clínicas y las conclusiones de investigación siguen requiriendo juicio humano.

Qué incluye

El README describe el proyecto como una colección de skills para investigación, computación científica, ingeniería, análisis, finanzas y escritura. Las áreas principales incluyen:

Bioinformática y genómica.
Quimioinformática y descubrimiento de fármacos.
Proteómica y espectrometría de masas.
Investigación clínica y medicina de precisión.
Healthcare AI y machine learning clínico.
Imagen médica y patología digital.
Machine learning y AI.
Ciencia de materiales y química.
Física y astronomía.
Simulación y optimización de ingeniería.
Análisis y visualización de datos.
Ciencia geoespacial y teledetección.
Automatización de laboratorio.
Escritura científica, revisión bibliográfica, peer review y gestión de citas.

Estas skills no buscan limitar al agent a ciertas librerías. El README también deja claro que el agent puede escribir Python y llamar cualquier API o paquete disponible. Las skills aportan documentación curada, ejemplos, buenas prácticas y rutas de integración.

En otras palabras, son una mezcla de manuales de herramientas científicas, plantillas de workflow y convenciones de llamada para agents.

Bases de datos y paquetes Python

La parte más atractiva para usuarios científicos es la cobertura de bases de datos y del ecosistema Python.

El README menciona:

Acceso unificado a 78 bases públicas mediante database-lookup.
Cobertura de PubChem, ChEMBL, UniProt, COSMIC, ClinicalTrials.gov, FRED, USPTO y más.
Skills dedicadas para DepMap, Imaging Data Commons, PrimeKG, U.S. Treasury Fiscal Data, Hugging Science y otras fuentes.
Más de 70 Python Package Skills optimizadas.

En el directorio aparecen muchos nombres conocidos:

rdkit
scanpy
biopython
bioservices
pydeseq2
scvelo
scvi-tools
pymatgen
qiskit
pennylane
openmm
mdanalysis
scikit-learn
statsmodels
matplotlib
seaborn
networkx
sympy
pytorch-lightning
transformers
timesfm-forecasting

Para un desarrollador, esas librerías no sorprenden por sí mismas. Lo útil es que el agent puede leer restricciones, ejemplos de código, flujos comunes y advertencias específicas mientras trabaja. Eso es más estable que depender solo de memoria antigua del modelo.

Escenarios típicos

Scientific Agent Skills sirve mejor para tareas de investigación con varios pasos que para preguntas de una sola vuelta.

En descubrimiento de fármacos, un agent podría consultar ChEMBL para inhibidores de EGFR, analizar relaciones estructura-actividad con RDKit, hacer screening virtual con DiffDock, buscar literatura y generar un informe.

En análisis single-cell, podría cargar datos 10X en Scanpy, hacer QC, integrar datasets, identificar tipos celulares, ejecutar expresión diferencial y enriquecimiento de vías.

En multi-omics, podría conectar RNA-seq, espectrometría de masas, metabolitos, interacciones de proteínas, ensayos clínicos y modelado estadístico.

Sin skills, estas tareas se convierten fácilmente en “el agent entiende la dirección general, pero hay que recordarle cada paso”. La biblioteca de skills guarda rutas frecuentes para reducir desvíos.

Instalación

El README recomienda la herramienta estándar de Agent Skills:

1

npx skills add K-Dense-AI/scientific-agent-skills

Si usas GitHub CLI v2.90.0+, también puedes instalar con gh skill:

1

gh skill install K-Dense-AI/scientific-agent-skills

Instalar una skill concreta:

1

gh skill install K-Dense-AI/scientific-agent-skills scanpy

Indicar un agent destino:

1
2
3
4


gh skill install K-Dense-AI/scientific-agent-skills --agent codex
gh skill install K-Dense-AI/scientific-agent-skills --agent cursor
gh skill install K-Dense-AI/scientific-agent-skills --agent claude-code
gh skill install K-Dense-AI/scientific-agent-skills --agent gemini

Para reproducibilidad, puedes fijar release tag o commit SHA:

1
2


gh skill install K-Dense-AI/scientific-agent-skills --pin v1.0.0
gh skill install K-Dense-AI/scientific-agent-skills --pin abc123def

Esto importa en investigación. Lo peor es “la semana pasada corría, esta semana cambió el resultado y nadie sabe por qué”. Si una skill participa en un análisis, registra skill, dependencias y versión de datos.

Requisitos de ejecución

El README lista:

Python 3.11+, recomendado 3.12+.
uv para instalar dependencias Python.
Un cliente compatible con Agent Skills.
macOS, Linux o Windows with WSL2.

Los usuarios de Windows deben fijarse en WSL2. Muchas librerías científicas pueden correr en Windows nativo, pero cadenas de dependencias, compiladores, paquetes binarios y rutas dan más problemas. La mención “Windows with WSL2” sugiere un entorno tipo Unix para computación científica.

Diferencia frente a una colección de prompts

Una colección de prompts suele decir al modelo cómo responder. Scientific Agent Skills va más allá: describe herramientas, librerías, bases de datos y workflows como skills descubribles.

Diferencias prácticas:

Una skill puede incluir instrucciones estructuradas y ejemplos de código.
Puede mantenerse alrededor de una librería o base de datos concreta.
El agent puede elegir skills según la tarea, en vez de cargar todas las reglas en el system prompt.
Un equipo puede instalar solo lo que necesita y reducir ruido de contexto.
Las skills pueden versionarse, revisarse y actualizarse con el repositorio.

Para investigación compleja, esto se mantiene mejor que copiar un prompt universal enorme. Modelos, bases de datos y paquetes Python cambian. Capturar esos cambios en skills es más controlable que dejarlos en documentos personales de prompts.

Seguridad y límites de confianza

La advertencia de seguridad del README es directa: las Skills pueden ejecutar código e influir en el comportamiento del coding agent.

Eso importa. Una skill científica puede instalar dependencias Python, acceder a bases de datos en red, leer y escribir archivos locales, ejecutar scripts de análisis, procesar datos experimentales o clínicos sensibles y generar informes que luego se citen.

No conviene instalar todo a ciegas. Una ruta más segura:

Instala solo las skills necesarias para la tarea.
Lee el SKILL.md correspondiente antes.
Revisa paquetes, API, archivos y servicios externos que puede llamar.
Ten más cuidado con skills aportadas por la comunidad.
Ejecuta tareas con datos y código en un entorno aislado.
Mantén revisión humana para conclusiones, sugerencias clínicas y resultados estadísticos.

El README también menciona Cisco AI Defense Skill Scanner y sugiere escanear skills de terceros localmente. El escaneo no sustituye la revisión humana, pero muestra conciencia del riesgo de supply chain de skills.

Para quién es

Este proyecto es más útil para quienes:

Ya usan AI coding agents a diario.
Procesan a menudo datos científicos, papers, gráficos e informes.
Cambian frecuentemente entre herramientas del ecosistema Python científico.
Quieren que un agent ejecute análisis de varios pasos, no solo explique conceptos.
Quieren convertir flujos de investigación del equipo en skills reutilizables.
Quieren estudiar cómo aplicar Agent Skills a dominios profesionales.

No encaja tanto si solo quieres que AI explique un paper de vez en cuando, no tienes entorno Python local, no quieres gestionar dependencias, no has definido límites de privacidad, red y ejecución de código, o necesitas un sistema clínico/productivo regulado sin revisión humana.

Para análisis ocasionales, pedir al agent que escriba un script puede ser más ligero. Si repites flujos parecidos, la biblioteca gana valor.

Consejos de uso

No empieces instalando todo el repositorio y entregando todas las tareas al agent.

Una ruta más práctica:

Elige una tarea de bajo riesgo, como organizar literatura, generar gráficos o explorar datos públicos.
Instala solo skills relevantes, como literature-review, scientific-writing, scanpy o rdkit.
Pide al agent que explique el plan antes de ejecutar código.
Conserva datos de entrada, scripts, entorno y versiones de skills.
Revisa manualmente los resultados.
Si el flujo se estabiliza, conviértelo en SOP o skill propia del equipo.

La clave de un agent científico no es automatizarlo todo. Es dar a las herramientas las partes repetitivas, tediosas y dependientes de documentación, y dejar juicio, hipótesis y conclusiones a las personas.

Resumen

Scientific Agent Skills importa porque lleva Agent Skills desde programación general hacia investigación.

El trabajo científico es naturalmente multi-herramienta, multi-base de datos, multi-archivo y multi-paso. Los prompts de chat por sí solos rara vez cubren esos detalles con estabilidad. Este proyecto convierte librerías, fuentes de datos y flujos de investigación comunes en skills, facilitando que un AI Agent entre en workflows reales.

Pero cuanto más potente es, más límites necesita. Las skills pueden cambiar el comportamiento del agent, ejecutar código, acceder a red y procesar archivos. Lee antes de instalar, aísla la ejecución y no saltes la validación humana de conclusiones científicas.

Si ya usas Codex, Claude Code, Cursor o Gemini CLI para investigación y análisis de datos, Scientific Agent Skills merece una mirada seria. Aunque no lo instales completo, su forma de dividir skills sirve como referencia para organizar workflows de AI científica en equipo.

Referencias: