Claude Code 額度省著用:模型選擇、上下文、快取與 /compact

整理 Claude Code 和 Claude Pro/Max 額度容易耗盡的原因:模型選擇、5 小時用量視窗、長對話、檔案和圖片、快取失效、CLAUDE.md、MCP 與 skills,並給出 /compact、/clear、/context、/status 等實用習慣。

最近很多人在用 Claude Code 或 Claude Max 時會遇到一個問題:明明買了 Pro、Max 5x,甚至 Max 20x,結果沒跑多久就提示額度快滿,或者直接需要等重置。尤其是在大專案裡讓 Claude Code 讀很多檔案、修複雜 bug、跑長任務時,這種感覺會更明顯。

這裡先說結論:額度不是按「時間」線性扣的,而是和模型、上下文長度、附件、程式碼庫規模、對話歷史、工具呼叫和目前容量都有關係。同樣 5 小時視窗,有的人能用很久,有的人十幾分鐘就耗盡,通常不是帳號壞了,而是每次請求都太重。

這篇整理一套比較實用的省額度習慣。

01 先理解 Claude 的用量視窗

Claude Pro 和 Max 都有使用限制,Claude Code 的使用量會和 Claude 網頁、桌面、行動端共享同一套訂閱額度。官方說明裡提到,訊息數量會受到訊息長度、附件大小、目前對話長度、所用模型或功能影響;Claude Code 還會受到專案複雜度、程式碼庫大小、自動接受設定等影響。

大致可以這樣理解:

  • Pro:適合輕量使用和小專案。
  • Max 5x:適合更頻繁使用和較大的程式碼庫。
  • Max 20x:適合更重度、日常高頻協作。
  • 用量視窗按 5 小時會話重置。
  • 長訊息、長對話、大檔案、複雜任務會更快消耗額度。
  • Opus 這類更強模型會比 Sonnet 更快觸發限制。

所以「我只用了 20 分鐘」這個說法不一定能說明問題。真正重要的是這 20 分鐘裡 Claude 讀了多少上下文、用了什麼模型、是否反覆處理大檔案、是否在同一個長對話裡繼續加任務。

02 第一件事:不要預設一直用最貴模型

Claude 系列裡常見的定位是:

  • Opus:能力最強,適合複雜推理、架構決策、疑難 bug。
  • Sonnet:能力和成本比較均衡,適合大部分日常編碼任務。
  • Haiku:更輕量,適合簡單分類、摘要、格式轉換等任務。

日常寫腳本、改小 bug、整理文件、解釋程式碼,大多數時候 Sonnet 已經夠用。Opus 更適合留給這些場景:

  • 複雜架構設計。
  • 多檔案深度重構。
  • 難復現的 bug。
  • 需要長鏈路推理的排障。
  • 普通模型明顯卡住的任務。

Claude Code 裡可以用 /model 切換模型,也可以在 /config 裡設定預設模型。比較穩的習慣是:預設 Sonnet,關鍵節點再切 Opus,而不是整場任務都用 Opus 扛。

03 第二件事:控制上下文,不要讓舊任務拖著走

上下文越長,Claude 每次處理要看的內容越多,額度消耗也越高。Claude Code 官方文件明確建議主動管理上下文:

  • 換到不相關任務時,用 /clear 清空歷史。
  • 目前任務做完一個階段但還要保留重點時,用 /compact 壓縮。
  • 想知道上下文裡什麼佔空間,用 /context
  • 想持續看到狀態,可以設定 status line。

一個好用的節奏是:

1
2
3
4
小階段完成:/compact
大任務結束:/clear
切換無關專案:/clear
上下文接近很高佔用:提前 /compact

/compact 會把前面的對話壓成摘要,保留關鍵任務狀態、結論、檔案路徑、待辦事項,但減少後續每次請求要攜帶的歷史。你也可以給它補一句重點:

1
/compact 保留已修改檔案、測試結果、剩餘待辦和關鍵設計決策

不要等自動壓縮才處理。官方文件提到,Claude Code 會在上下文接近容量上限時自動壓縮,但手動在階段邊界壓縮,通常更可控。

04 第三件事:長對話和大檔案會讓每次請求變貴

很多人以為「我只是繼續問一句」,應該很便宜。但在長對話裡,這一句背後可能帶著大量歷史、檔案摘要、工具定義和系統規則。

特別容易漲上下文的東西包括:

  • 一直不清理的長對話。
  • 讓 Claude 讀完整大檔案。
  • 貼很長日誌、建置輸出、測試輸出。
  • 一次性塞很多截圖或圖片。
  • 讓它反覆掃描整個倉庫。
  • 過長的 CLAUDE.md
  • 開了很多 MCP server。

比較省的做法是:日誌只貼關鍵報錯,測試輸出只給失敗部分,大檔案讓它先用 rgheadtail、符號搜尋定位,再讀必要片段。能用命令列過濾的內容,不要整包塞進上下文。

05 第四件事:理解快取,但不要迷信快取

Anthropic 的 Prompt Caching 會快取重複的 prompt 前綴。預設快取生命週期是 5 分鐘,也支援 1 小時快取。快取命中時,重複的大段上下文不需要完整重新處理,有助於降低成本和改善額度利用。

但快取有幾個限制:

  • 需要內容完全匹配,文字和圖片都要一致。
  • 預設快取是短生命週期。
  • 改模型、改工具、改系統提示、改上下文結構,都可能降低命中。
  • 輸出 token 不會因為快取而消失,該生成的回答仍然要生成。
  • Claude Code 具體如何利用快取,是產品層實作細節,不要把它當成永遠穩定的「免費記憶」。

實際使用裡,最重要的不是研究快取細節,而是保持會話穩定:

  • 同一階段盡量別頻繁切模型。
  • 不要中途反覆改大量規則。
  • 不要在同一任務裡不停貼新圖片。
  • 長任務中間不要閒置太久後又繼續塞大請求。
  • 階段結束主動 /compact

這樣更容易讓重複上下文保持可複用,也能降低後續請求負擔。

06 關於尖峰時段:能避開就避開,但不要當固定公式

網路上常有人說某些時段額度會更緊。官方幫助中心的表述更謹慎:可發送數量會受到 Claude 目前容量、對話長度、附件、模型和功能影響。也就是說,尖峰容量確實可能影響體驗,但不要把某個地區的某個時間段當成永久固定規則。

實用建議是:

  • 大重構、大批次分析盡量放到自己網路和服務都穩定的時段。
  • 不要在快到休息時開啟一個超長任務。
  • 預計會離開很久時,先 /compact/clear
  • 如果只是小改動,不要開 Opus 加長上下文硬跑。

這比記一個固定「幾點到幾點不能用」的規則更可靠。

07 精簡 CLAUDE.md、rules、MCP 和 skills

Claude Code 會在會話中載入專案規則、工具資訊和一部分環境上下文。官方文件也建議把通用規則和專用規則分開,避免每次啟動都帶著一大包不相關內容。

比較推薦的拆法:

  • CLAUDE.md:只放全域都適用的核心規則。
  • rules:放特定路徑、特定檔案類型才需要的規則。
  • skills:放特定工作流,例如發文章、部署、生成圖片、提交程式碼。
  • MCP:只啟用目前任務真的會用到的 server。

如果 CLAUDE.md 寫了幾百上千行,每次會話都要帶進去。更好的方式是把「偶爾才用」的流程移到 skill 裡,需要時再呼叫。

MCP 也是一樣。工具多不等於效率高。Claude Code 文件提到可以用 /mcp 查看並停用不需要的 server,也可以用 /context 看是什麼佔用了上下文空間。

08 實用指令清單

日常最常用的是這幾個:

1
/model

切換模型。預設建議用 Sonnet,複雜推理再用 Opus。

1
/clear

清空目前上下文。換無關任務時用,最省。

1
/compact

壓縮歷史上下文。一個階段完成但還要繼續同一任務時用。

1
/context

查看上下文佔用,排查是什麼吃掉空間。

1
/status

查看目前訂閱或額度相關狀態。官方幫助中心也建議用它監控剩餘額度。

1
/mcp

查看和管理 MCP server,關閉目前不用的工具。

如果你用 API 計費模式,還可以關注 /cost;但如果是 Pro/Max 訂閱,官方文件說明 /cost 的美元估算不適合作為訂閱帳單依據,訂閱使用者更應該看 /stats/status 這類使用資訊。

09 一套省額度工作流

比較順手的流程可以是這樣:

  1. 新任務開始前先 /clear
  2. 預設用 Sonnet。
  3. 先讓 Claude 讀專案結構和關鍵檔案,不要一口氣讀全倉庫。
  4. 每做完一個小階段就 /compact
  5. 複雜卡點再切 Opus。
  6. 日誌、報錯、測試輸出先過濾再給。
  7. 任務完成後 /clear,不要拖著舊上下文開新活。
  8. 定期檢查 CLAUDE.md、MCP 和 skills,把常駐上下文壓小。

這個流程的核心是:讓 Claude 每次只看目前真正需要看的東西。

10 小結

Claude Code 額度快速耗盡,通常不是單一原因,而是幾個因素疊加:用了高成本模型、長對話一直不清、檔案和日誌塞太多、MCP 和規則常駐過重、快取命中變差,再加上尖峰容量波動。

省額度的核心也很簡單:

  • 日常任務優先 Sonnet。
  • Opus 留給真正複雜的問題。
  • 階段完成用 /compact
  • 換任務用 /clear
  • /context 找上下文佔用來源。
  • 精簡 CLAUDE.md、rules、MCP 和 skills。
  • 不要把整倉庫、整日誌、整圖片包都丟進去。

同樣的 Pro 或 Max 方案,能做多少事,很大程度取決於你怎麼管理上下文。把上下文變小、任務邊界變清楚,Claude Code 的可用時間和穩定性都會明顯好很多。

參考連結

记录并分享
使用 Hugo 建立
主題 StackJimmy 設計