Claude Code 最近有一次很典型的計費故障:使用者只是啟動 CLI,還沒有正式發出請求,就因為本機 HERMES.md 檔案被讀取而產生了大額費用。
這件事值得單獨看,不是因為某個使用者損失了多少錢,而是因為它暴露了 AI 程式設計工具的一個新風險:只要工具會自動讀取上下文,本機檔案就可能變成真實 token 成本。
發生了什麼
公開 issue 顯示,使用者在工作目錄裡放了一個很大的 HERMES.md 檔案。啟動 Claude Code 後,CLI 會掃描並載入專案上下文。問題在於,這個檔案被自動納入上下文,並被計入 API 使用量。
使用者並沒有明確要求模型處理這份檔案,但計費已經發生。更麻煩的是,這類行為發生在工具初始化或上下文準備階段,使用者不一定能第一時間意識到費用正在產生。
Anthropic 後續在 issue 中回覆,表示會退還異常費用,並額外提供額度補償。這個回應說明問題至少已被官方確認和處理,但它仍然提醒使用者:AI CLI 的「自動上下文」不是免費的。
HERMES.md 為什麼會觸發問題
HERMES.md 本身不是重點。它可以換成任何大檔案:長日誌、匯出的文件、測試資料、資料庫 dump、生成報告,都可能造成類似問題。
真正的問題在於三件事疊加:
- Claude Code 會自動讀取專案上下文。
- 被讀取的檔案可能很大。
- 上下文 token 會進入計費鏈路。
如果一個檔案足夠大,哪怕只是被工具「順手帶上」,也可能產生明顯費用。對按 token 計費的模型來說,自動化越強,越需要明確邊界。
這不是普通 bug
普通 CLI bug 可能只是命令失敗、輸出錯誤或功能不可用。計費 bug 更敏感,因為它直接影響使用者帳單。
對 AI 程式設計工具來說,計費邊界很容易變模糊:
- 系統提示會消耗 token。
- 專案規則會消耗 token。
- 自動讀取的檔案會消耗 token。
- 工具調用結果會消耗 token。
- 重試、壓縮、摘要也可能繼續消耗 token。
使用者看到的是一次「啟動工具」或「一次對話」,後臺實際可能已經發生多次請求和大量上下文傳輸。
使用者應該怎麼防
如果你使用 Claude Code、Codex、Cline 這類 AI 程式設計工具,可以先做幾件事:
- 不要把大檔案直接放在專案根目錄。
- 把日誌、匯出資料、構建產物、臨時檔案加入忽略規則。
- 檢查工具是否支援類似
.ignore、上下文排除、檔案白名單的配置。 - 開啟預算提醒或用量限制。
- 第一次在大型倉庫執行前,先用小目錄測試。
如果倉庫裡必須保留大檔案,最好明確告訴工具不要讀取它們。專案規則裡也可以寫清楚:不要主動讀取日誌、dump、資料集、歸檔檔案和大體積 Markdown。
工具廠商該怎麼改
這類問題不能只靠使用者小心。工具本身也應該給出硬邊界。
更合理的設計包括:
- 初始化階段不應隱式計入大檔案。
- 自動讀取超大檔案前要提示使用者確認。
- CLI 應顯示本次請求預估 token 和費用區間。
- 預設忽略常見大檔案和生成目錄。
- 對異常 token 激增設定保護閾值。
AI 程式設計工具越像「自動代理」,越需要把成本透明化。否則使用者很難判斷一次操作到底會產生多少費用。
小結
Claude Code 的 HERMES.md 計費故障,本質上是自動上下文和按量計費之間的衝突。
對使用者來說,最重要的是把專案上下文管住:大檔案不要預設暴露給 AI 工具,預算和用量也要設上限。對工具廠商來說,自動讀取檔案必須配套可見的成本提示和保護機制。
參考: