Claude Code 額度省著用：模型選擇、上下文、快取與 /compact

最近很多人在用 Claude Code 或 Claude Max 時會遇到一個問題：明明買了 Pro、Max 5x，甚至 Max 20x，結果沒跑多久就提示額度快滿，或者直接需要等重置。尤其是在大專案裡讓 Claude Code 讀很多檔案、修複雜 bug、跑長任務時，這種感覺會更明顯。

這裡先說結論：額度不是按「時間」線性扣的，而是和模型、上下文長度、附件、程式碼庫規模、對話歷史、工具呼叫和目前容量都有關係。同樣 5 小時視窗，有的人能用很久，有的人十幾分鐘就耗盡，通常不是帳號壞了，而是每次請求都太重。

這篇整理一套比較實用的省額度習慣。

01 先理解 Claude 的用量視窗

Claude Pro 和 Max 都有使用限制，Claude Code 的使用量會和 Claude 網頁、桌面、行動端共享同一套訂閱額度。官方說明裡提到，訊息數量會受到訊息長度、附件大小、目前對話長度、所用模型或功能影響；Claude Code 還會受到專案複雜度、程式碼庫大小、自動接受設定等影響。

大致可以這樣理解：

Pro：適合輕量使用和小專案。
Max 5x：適合更頻繁使用和較大的程式碼庫。
Max 20x：適合更重度、日常高頻協作。
用量視窗按 5 小時會話重置。
長訊息、長對話、大檔案、複雜任務會更快消耗額度。
Opus 這類更強模型會比 Sonnet 更快觸發限制。

所以「我只用了 20 分鐘」這個說法不一定能說明問題。真正重要的是這 20 分鐘裡 Claude 讀了多少上下文、用了什麼模型、是否反覆處理大檔案、是否在同一個長對話裡繼續加任務。

02 第一件事：不要預設一直用最貴模型

Claude 系列裡常見的定位是：

Opus：能力最強，適合複雜推理、架構決策、疑難 bug。
Sonnet：能力和成本比較均衡，適合大部分日常編碼任務。
Haiku：更輕量，適合簡單分類、摘要、格式轉換等任務。

日常寫腳本、改小 bug、整理文件、解釋程式碼，大多數時候 Sonnet 已經夠用。Opus 更適合留給這些場景：

複雜架構設計。
多檔案深度重構。
難復現的 bug。
需要長鏈路推理的排障。
普通模型明顯卡住的任務。

Claude Code 裡可以用 /model 切換模型，也可以在 /config 裡設定預設模型。比較穩的習慣是：預設 Sonnet，關鍵節點再切 Opus，而不是整場任務都用 Opus 扛。

03 第二件事：控制上下文，不要讓舊任務拖著走

上下文越長，Claude 每次處理要看的內容越多，額度消耗也越高。Claude Code 官方文件明確建議主動管理上下文：

換到不相關任務時，用 /clear 清空歷史。
目前任務做完一個階段但還要保留重點時，用 /compact 壓縮。
想知道上下文裡什麼佔空間，用 /context。
想持續看到狀態，可以設定 status line。

一個好用的節奏是：

1
2
3
4


小階段完成：/compact
大任務結束：/clear
切換無關專案：/clear
上下文接近很高佔用：提前 /compact

/compact 會把前面的對話壓成摘要，保留關鍵任務狀態、結論、檔案路徑、待辦事項，但減少後續每次請求要攜帶的歷史。你也可以給它補一句重點：

1

/compact 保留已修改檔案、測試結果、剩餘待辦和關鍵設計決策

不要等自動壓縮才處理。官方文件提到，Claude Code 會在上下文接近容量上限時自動壓縮，但手動在階段邊界壓縮，通常更可控。

04 第三件事：長對話和大檔案會讓每次請求變貴

很多人以為「我只是繼續問一句」，應該很便宜。但在長對話裡，這一句背後可能帶著大量歷史、檔案摘要、工具定義和系統規則。

特別容易漲上下文的東西包括：

一直不清理的長對話。
讓 Claude 讀完整大檔案。
貼很長日誌、建置輸出、測試輸出。
一次性塞很多截圖或圖片。
讓它反覆掃描整個倉庫。
過長的 CLAUDE.md。
開了很多 MCP server。

比較省的做法是：日誌只貼關鍵報錯，測試輸出只給失敗部分，大檔案讓它先用 rg、head、tail、符號搜尋定位，再讀必要片段。能用命令列過濾的內容，不要整包塞進上下文。

05 第四件事：理解快取，但不要迷信快取

Anthropic 的 Prompt Caching 會快取重複的 prompt 前綴。預設快取生命週期是 5 分鐘，也支援 1 小時快取。快取命中時，重複的大段上下文不需要完整重新處理，有助於降低成本和改善額度利用。

但快取有幾個限制：

需要內容完全匹配，文字和圖片都要一致。
預設快取是短生命週期。
改模型、改工具、改系統提示、改上下文結構，都可能降低命中。
輸出 token 不會因為快取而消失，該生成的回答仍然要生成。
Claude Code 具體如何利用快取，是產品層實作細節，不要把它當成永遠穩定的「免費記憶」。

實際使用裡，最重要的不是研究快取細節，而是保持會話穩定：

同一階段盡量別頻繁切模型。
不要中途反覆改大量規則。
不要在同一任務裡不停貼新圖片。
長任務中間不要閒置太久後又繼續塞大請求。
階段結束主動 /compact。

這樣更容易讓重複上下文保持可複用，也能降低後續請求負擔。

06 關於尖峰時段：能避開就避開，但不要當固定公式

網路上常有人說某些時段額度會更緊。官方幫助中心的表述更謹慎：可發送數量會受到 Claude 目前容量、對話長度、附件、模型和功能影響。也就是說，尖峰容量確實可能影響體驗，但不要把某個地區的某個時間段當成永久固定規則。

實用建議是：

大重構、大批次分析盡量放到自己網路和服務都穩定的時段。
不要在快到休息時開啟一個超長任務。
預計會離開很久時，先 /compact 或 /clear。
如果只是小改動，不要開 Opus 加長上下文硬跑。

這比記一個固定「幾點到幾點不能用」的規則更可靠。

07 精簡 CLAUDE.md、rules、MCP 和 skills

Claude Code 會在會話中載入專案規則、工具資訊和一部分環境上下文。官方文件也建議把通用規則和專用規則分開，避免每次啟動都帶著一大包不相關內容。

比較推薦的拆法：

CLAUDE.md：只放全域都適用的核心規則。
rules：放特定路徑、特定檔案類型才需要的規則。
skills：放特定工作流，例如發文章、部署、生成圖片、提交程式碼。
MCP：只啟用目前任務真的會用到的 server。

如果 CLAUDE.md 寫了幾百上千行，每次會話都要帶進去。更好的方式是把「偶爾才用」的流程移到 skill 裡，需要時再呼叫。

MCP 也是一樣。工具多不等於效率高。Claude Code 文件提到可以用 /mcp 查看並停用不需要的 server，也可以用 /context 看是什麼佔用了上下文空間。

08 實用指令清單

日常最常用的是這幾個：

1

/model

切換模型。預設建議用 Sonnet，複雜推理再用 Opus。

1

/clear

清空目前上下文。換無關任務時用，最省。

1

/compact

壓縮歷史上下文。一個階段完成但還要繼續同一任務時用。

1

/context

查看上下文佔用，排查是什麼吃掉空間。

1

/status

查看目前訂閱或額度相關狀態。官方幫助中心也建議用它監控剩餘額度。

1

/mcp

查看和管理 MCP server，關閉目前不用的工具。

如果你用 API 計費模式，還可以關注 /cost；但如果是 Pro/Max 訂閱，官方文件說明 /cost 的美元估算不適合作為訂閱帳單依據，訂閱使用者更應該看 /stats 和 /status 這類使用資訊。

09 一套省額度工作流

比較順手的流程可以是這樣：

新任務開始前先 /clear。
預設用 Sonnet。
先讓 Claude 讀專案結構和關鍵檔案，不要一口氣讀全倉庫。
每做完一個小階段就 /compact。
複雜卡點再切 Opus。
日誌、報錯、測試輸出先過濾再給。
任務完成後 /clear，不要拖著舊上下文開新活。
定期檢查 CLAUDE.md、MCP 和 skills，把常駐上下文壓小。

這個流程的核心是：讓 Claude 每次只看目前真正需要看的東西。

10 小結

Claude Code 額度快速耗盡，通常不是單一原因，而是幾個因素疊加：用了高成本模型、長對話一直不清、檔案和日誌塞太多、MCP 和規則常駐過重、快取命中變差，再加上尖峰容量波動。

省額度的核心也很簡單：

日常任務優先 Sonnet。
Opus 留給真正複雜的問題。
階段完成用 /compact。
換任務用 /clear。
用 /context 找上下文佔用來源。
精簡 CLAUDE.md、rules、MCP 和 skills。
不要把整倉庫、整日誌、整圖片包都丟進去。

同樣的 Pro 或 Max 方案，能做多少事，很大程度取決於你怎麼管理上下文。把上下文變小、任務邊界變清楚，Claude Code 的可用時間和穩定性都會明顯好很多。

參考連結

Claude Help Center：Using Claude Code with your Pro or Max plan：https://support.claude.com/en/articles/11145838-using-claude-code-with-your-pro-or-max-plan
Claude Help Center：About Claude’s Max Plan Usage：https://support.anthropic.com/en/articles/11014257-about-claude-s-max-plan-usage/
Claude Code Docs：Manage costs effectively：https://code.claude.com/docs/en/costs
Anthropic Docs：Prompt caching：https://docs.anthropic.com/en/docs/build-with-claude/prompt-caching