Qué ocurrió en el incidente de facturación HERMES.md de Claude Code

Claude Code tuvo recientemente un incidente de facturación bastante típico: un usuario solo inició el CLI y no había hecho una petición explícita, pero un archivo local grande HERMES.md fue leído y generó un cargo considerable.

Vale la pena mirarlo porque expone un nuevo riesgo en herramientas de programación con IA. En cuanto una herramienta lee contexto automáticamente, los archivos locales pueden convertirse en coste real de tokens.

Qué ocurrió

El issue público muestra que el usuario tenía un archivo HERMES.md grande en el directorio de trabajo. Cuando Claude Code arrancó, el CLI escaneó y cargó contexto del proyecto. El problema fue que ese archivo se incluyó automáticamente en el contexto y contó como uso de API.

El usuario no pidió explícitamente al modelo procesar ese archivo, pero la facturación ya había ocurrido. La parte más delicada es que esto puede pasar durante inicialización o preparación de contexto, así que los usuarios pueden no darse cuenta de inmediato de que se está generando coste.

Anthropic respondió después en el issue que reembolsaría el cargo anómalo y daría créditos adicionales. Eso confirma que el problema fue reconocido y gestionado, pero también recuerda a los usuarios que el “contexto automático” en un CLI de IA no es gratis.

Por qué HERMES.md lo disparó

HERMES.md en sí no es el punto. Podría ser cualquier archivo grande: logs, documentos exportados, datos de prueba, volcados de base de datos o informes generados.

El problema real es la combinación de tres cosas:

Claude Code lee automáticamente el contexto del proyecto.
El archivo leído puede ser grande.
Los tokens de contexto entran en la ruta de facturación.

Si un archivo es lo bastante grande, incluso ser incluido “de pasada” puede crear un coste notable. Para modelos basados en tokens, una automatización más fuerte necesita límites más claros.

No es un bug ordinario

Un bug normal de CLI puede significar un comando fallido, una salida incorrecta o una función rota. Un bug de facturación es más sensible porque afecta directamente a la factura del usuario.

En herramientas de programación con IA, el límite de facturación puede ser borroso:

Los system prompts consumen tokens.
Las reglas de proyecto consumen tokens.
Los archivos leídos automáticamente consumen tokens.
Los resultados de llamadas de herramientas consumen tokens.
Reintentos, compresión y resúmenes pueden seguir consumiendo tokens.

El usuario puede ver solo “arrancar la herramienta” o “un chat”, mientras en segundo plano ya se enviaron varias solicitudes con mucho contexto.

Cómo pueden reducir el riesgo los usuarios

Si usas Claude Code, Codex, Cline o herramientas similares de programación con IA, empieza con algunos hábitos:

No pongas archivos grandes directamente en la raíz del proyecto.
Añade logs, datos exportados, salidas de build y archivos temporales a reglas de ignore.
Comprueba si la herramienta admite .ignore, exclusión de contexto o allowlists de archivos.
Activa alertas de presupuesto o límites de uso.
Prueba en un directorio pequeño antes de ejecutarla en un repositorio grande.

Si un repositorio debe conservar archivos grandes, dile explícitamente a la herramienta que no los lea. Las reglas de proyecto también pueden decir: no leer proactivamente logs, dumps, datasets, archivos comprimidos ni Markdown grandes.

Qué deberían mejorar los proveedores

Esto no puede depender solo de la cautela del usuario. Las herramientas deberían ofrecer límites duros.

Mejores diseños incluirían:

La inicialización no debería facturar silenciosamente por archivos grandes.
Leer automáticamente archivos muy grandes debería requerir confirmación.
El CLI debería mostrar tokens estimados y rango de coste para la solicitud.
Archivos grandes comunes y directorios generados deberían ignorarse por defecto.
Los picos anómalos de tokens deberían tener umbrales de protección.

Cuanto más se comporten las herramientas de programación con IA como agentes autónomos, más transparentes deben ser sus costes. De lo contrario, los usuarios no pueden juzgar cuánto costará una operación concreta.

Resumen

El incidente de facturación HERMES.md de Claude Code es, en esencia, un conflicto entre contexto automático y facturación por uso.

Para usuarios, la clave es controlar el contexto del proyecto: no exponer archivos grandes a herramientas de IA por defecto, y configurar límites de presupuesto y uso. Para proveedores, la lectura automática de archivos necesita avisos visibles de coste y mecanismos de protección.

Referencias: