Claude Code 的 HERMES.md 计费故障是怎么回事

Anthropic Claude Code 曾出现与 HERMES.md 相关的异常计费问题。公开 issue 显示,问题来自 CLI 初始化阶段把本地上下文计入费用,Anthropic 后续表示会退款并补偿额度。

Claude Code 最近有一次很典型的计费故障:用户只是启动 CLI,还没有正式发出请求,就因为本地 HERMES.md 文件被读取而产生了大额费用。

这件事值得单独看,不是因为某个用户损失了多少钱,而是因为它暴露了 AI 编程工具的一个新风险:只要工具会自动读取上下文,本地文件就可能变成真实 token 成本。

发生了什么

公开 issue 显示,用户在工作目录里放了一个很大的 HERMES.md 文件。启动 Claude Code 后,CLI 会扫描并加载项目上下文。问题在于,这个文件被自动纳入上下文,并被计入 API 使用量。

用户并没有明确要求模型处理这份文件,但计费已经发生。更麻烦的是,这类行为发生在工具初始化或上下文准备阶段,用户不一定能第一时间意识到费用正在产生。

Anthropic 后续在 issue 中回复,表示会退还异常费用,并额外提供额度补偿。这个回应说明问题至少已被官方确认和处理,但它仍然提醒用户:AI CLI 的“自动上下文”不是免费的。

HERMES.md 为什么会触发问题

HERMES.md 本身不是重点。它可以换成任何大文件:长日志、导出的文档、测试数据、数据库 dump、生成报告,都可能造成类似问题。

真正的问题在于三件事叠加:

  1. Claude Code 会自动读取项目上下文。
  2. 被读取的文件可能很大。
  3. 上下文 token 会进入计费链路。

如果一个文件足够大,哪怕只是被工具“顺手带上”,也可能产生明显费用。对按 token 计费的模型来说,自动化越强,越需要明确边界。

这不是普通 bug

普通 CLI bug 可能只是命令失败、输出错误或功能不可用。计费 bug 更敏感,因为它直接影响用户账单。

对 AI 编程工具来说,计费边界很容易变模糊:

  1. 系统提示会消耗 token。
  2. 项目规则会消耗 token。
  3. 自动读取的文件会消耗 token。
  4. 工具调用结果会消耗 token。
  5. 重试、压缩、摘要也可能继续消耗 token。

用户看到的是一次“启动工具”或“一次对话”,后台实际可能已经发生多次请求和大量上下文传输。

用户应该怎么防

如果你使用 Claude Code、Codex、Cline 这类 AI 编程工具,可以先做几件事:

  1. 不要把大文件直接放在项目根目录。
  2. 把日志、导出数据、构建产物、临时文件加入忽略规则。
  3. 检查工具是否支持类似 .ignore、上下文排除、文件白名单的配置。
  4. 开启预算提醒或用量限制。
  5. 第一次在大型仓库运行前,先用小目录测试。

如果仓库里必须保留大文件,最好明确告诉工具不要读取它们。项目规则里也可以写清楚:不要主动读取日志、dump、数据集、归档文件和大体积 Markdown。

工具厂商该怎么改

这类问题不能只靠用户小心。工具本身也应该给出硬边界。

更合理的设计包括:

  1. 初始化阶段不应隐式计入大文件。
  2. 自动读取超大文件前要提示用户确认。
  3. CLI 应显示本次请求预计 token 和费用区间。
  4. 默认忽略常见大文件和生成目录。
  5. 对异常 token 激增设置保护阈值。

AI 编程工具越像“自动代理”,越需要把成本透明化。否则用户很难判断一次操作到底会产生多少费用。

小结

Claude Code 的 HERMES.md 计费故障,本质上是自动上下文和按量计费之间的冲突。

对用户来说,最重要的是把项目上下文管住:大文件不要默认暴露给 AI 工具,预算和用量也要设上限。对工具厂商来说,自动读取文件必须配套可见的成本提示和保护机制。

参考:

记录并分享
使用 Hugo 构建
主题 StackJimmy 设计