<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>上下文管理 on KnightLi的博客</title>
        <link>https://www.knightli.com/tags/%E4%B8%8A%E4%B8%8B%E6%96%87%E7%AE%A1%E7%90%86/</link>
        <description>Recent content in 上下文管理 on KnightLi的博客</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-cn</language>
        <lastBuildDate>Sun, 19 Apr 2026 15:26:56 +0800</lastBuildDate><atom:link href="https://www.knightli.com/tags/%E4%B8%8A%E4%B8%8B%E6%96%87%E7%AE%A1%E7%90%86/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>Claude Code 额度省着用：模型选择、上下文、缓存与 /compact</title>
        <link>https://www.knightli.com/2026/04/19/claude-code-usage-context-compact-notes/</link>
        <pubDate>Sun, 19 Apr 2026 15:26:56 +0800</pubDate>
        
        <guid>https://www.knightli.com/2026/04/19/claude-code-usage-context-compact-notes/</guid>
        <description>&lt;p&gt;最近很多人在用 Claude Code 或 Claude Max 时会遇到一个问题：明明买了 Pro、Max 5x，甚至 Max 20x，结果没跑多久就提示额度快满，或者直接需要等重置。尤其是在大项目里让 Claude Code 读很多文件、修复杂 bug、跑长任务时，这种感觉会更明显。&lt;/p&gt;
&lt;p&gt;这里先说结论：额度不是按“时间”线性扣的，而是和模型、上下文长度、附件、代码库规模、对话历史、工具调用和当前容量都有关系。同样 5 小时窗口，有的人能用很久，有的人十几分钟就耗尽，通常不是账号坏了，而是每次请求都太重。&lt;/p&gt;
&lt;p&gt;这篇整理一套比较实用的省额度习惯。&lt;/p&gt;
&lt;h2 id=&#34;01-先理解-claude-的用量窗口&#34;&gt;01 先理解 Claude 的用量窗口
&lt;/h2&gt;&lt;p&gt;Claude Pro 和 Max 都有使用限制，Claude Code 的使用量会和 Claude 网页、桌面、移动端共享同一套订阅额度。官方说明里提到，消息数量会受到消息长度、附件大小、当前对话长度、所用模型或功能影响；Claude Code 还会受到项目复杂度、代码库大小、自动接受设置等影响。&lt;/p&gt;
&lt;p&gt;大致可以这样理解：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Pro：适合轻量使用和小项目。&lt;/li&gt;
&lt;li&gt;Max 5x：适合更频繁使用和较大的代码库。&lt;/li&gt;
&lt;li&gt;Max 20x：适合更重度、日常高频协作。&lt;/li&gt;
&lt;li&gt;用量窗口按 5 小时会话重置。&lt;/li&gt;
&lt;li&gt;长消息、长对话、大文件、复杂任务会更快消耗额度。&lt;/li&gt;
&lt;li&gt;Opus 这类更强模型会比 Sonnet 更快触发限制。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;所以“我只用了 20 分钟”这个说法不一定能说明问题。真正重要的是这 20 分钟里 Claude 读了多少上下文、用了什么模型、是否反复处理大文件、是否在同一个长对话里继续加任务。&lt;/p&gt;
&lt;h2 id=&#34;02-第一件事不要默认一直用最贵模型&#34;&gt;02 第一件事：不要默认一直用最贵模型
&lt;/h2&gt;&lt;p&gt;Claude 系列里常见的定位是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;Opus&lt;/code&gt;：能力最强，适合复杂推理、架构决策、疑难 bug。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;Sonnet&lt;/code&gt;：能力和成本比较均衡，适合大部分日常编码任务。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;Haiku&lt;/code&gt;：更轻量，适合简单分类、摘要、格式转换等任务。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;日常写脚本、改小 bug、整理文档、解释代码，大多数时候 Sonnet 已经够用。Opus 更适合留给这些场景：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;复杂架构设计。&lt;/li&gt;
&lt;li&gt;多文件深度重构。&lt;/li&gt;
&lt;li&gt;难复现的 bug。&lt;/li&gt;
&lt;li&gt;需要长链路推理的排障。&lt;/li&gt;
&lt;li&gt;普通模型明显卡住的任务。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Claude Code 里可以用 &lt;code&gt;/model&lt;/code&gt; 切换模型，也可以在 &lt;code&gt;/config&lt;/code&gt; 里设置默认模型。比较稳的习惯是：默认 Sonnet，关键节点再切 Opus，而不是整场任务都用 Opus 扛。&lt;/p&gt;
&lt;h2 id=&#34;03-第二件事控制上下文不要让旧任务拖着走&#34;&gt;03 第二件事：控制上下文，不要让旧任务拖着走
&lt;/h2&gt;&lt;p&gt;上下文越长，Claude 每次处理要看的内容越多，额度消耗也越高。Claude Code 官方文档明确建议主动管理上下文：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;换到不相关任务时，用 &lt;code&gt;/clear&lt;/code&gt; 清空历史。&lt;/li&gt;
&lt;li&gt;当前任务做完一个阶段但还要保留重点时，用 &lt;code&gt;/compact&lt;/code&gt; 压缩。&lt;/li&gt;
&lt;li&gt;想知道上下文里什么占空间，用 &lt;code&gt;/context&lt;/code&gt;。&lt;/li&gt;
&lt;li&gt;想持续看到状态，可以配置 status line。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;一个好用的节奏是：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;4
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;小阶段完成：/compact
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;大任务结束：/clear
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;切换无关项目：/clear
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;上下文接近很高占用：提前 /compact
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;&lt;code&gt;/compact&lt;/code&gt; 会把前面的对话压成摘要，保留关键任务状态、结论、文件路径、待办事项，但减少后续每次请求要携带的历史。你也可以给它补一句重点：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;/compact 保留已修改文件、测试结果、剩余待办和关键设计决策
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;不要等自动压缩才处理。官方文档提到，Claude Code 会在上下文接近容量上限时自动压缩，但手动在阶段边界压缩，通常更可控。&lt;/p&gt;
&lt;h2 id=&#34;04-第三件事长对话和大文件会让每次请求变贵&#34;&gt;04 第三件事：长对话和大文件会让每次请求变贵
&lt;/h2&gt;&lt;p&gt;很多人以为“我只是继续问一句”，应该很便宜。但在长对话里，这一句背后可能带着大量历史、文件摘要、工具定义和系统规则。&lt;/p&gt;
&lt;p&gt;特别容易涨上下文的东西包括：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;一直不清理的长对话。&lt;/li&gt;
&lt;li&gt;让 Claude 读完整大文件。&lt;/li&gt;
&lt;li&gt;贴很长日志、构建输出、测试输出。&lt;/li&gt;
&lt;li&gt;一次性塞很多截图或图片。&lt;/li&gt;
&lt;li&gt;让它反复扫描整个仓库。&lt;/li&gt;
&lt;li&gt;过长的 &lt;code&gt;CLAUDE.md&lt;/code&gt;。&lt;/li&gt;
&lt;li&gt;开了很多 MCP server。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;比较省的做法是：日志只贴关键报错，测试输出只给失败部分，大文件让它先用 &lt;code&gt;rg&lt;/code&gt;、&lt;code&gt;head&lt;/code&gt;、&lt;code&gt;tail&lt;/code&gt;、符号搜索定位，再读必要片段。能用命令行过滤的内容，不要整包塞进上下文。&lt;/p&gt;
&lt;h2 id=&#34;05-第四件事理解缓存但不要迷信缓存&#34;&gt;05 第四件事：理解缓存，但不要迷信缓存
&lt;/h2&gt;&lt;p&gt;Anthropic 的 Prompt Caching 会缓存重复的 prompt 前缀。默认缓存生命周期是 5 分钟，也支持 1 小时缓存。缓存命中时，重复的大段上下文不需要完整重新处理，有助于降低成本和改善额度利用。&lt;/p&gt;
&lt;p&gt;但缓存有几个限制：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;需要内容完全匹配，文字和图片都要一致。&lt;/li&gt;
&lt;li&gt;默认缓存是短生命周期。&lt;/li&gt;
&lt;li&gt;改模型、改工具、改系统提示、改上下文结构，都可能降低命中。&lt;/li&gt;
&lt;li&gt;输出 token 不会因为缓存而消失，该生成的回答仍然要生成。&lt;/li&gt;
&lt;li&gt;Claude Code 具体如何利用缓存，是产品层实现细节，不要把它当成永远稳定的“免费记忆”。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;实际使用里，最重要的不是研究缓存细节，而是保持会话稳定：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;同一阶段尽量别频繁切模型。&lt;/li&gt;
&lt;li&gt;不要中途反复改大量规则。&lt;/li&gt;
&lt;li&gt;不要在同一任务里不停贴新图片。&lt;/li&gt;
&lt;li&gt;长任务中间不要闲置太久后又继续塞大请求。&lt;/li&gt;
&lt;li&gt;阶段结束主动 &lt;code&gt;/compact&lt;/code&gt;。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这样更容易让重复上下文保持可复用，也能降低后续请求负担。&lt;/p&gt;
&lt;h2 id=&#34;06-关于高峰时段能避开就避开但不要当固定公式&#34;&gt;06 关于高峰时段：能避开就避开，但不要当固定公式
&lt;/h2&gt;&lt;p&gt;网上常有人说某些时段额度会更紧。官方帮助中心的表述更谨慎：可发送数量会受到 Claude 当前容量、对话长度、附件、模型和功能影响。也就是说，高峰容量确实可能影响体验，但不要把某个地区的某个时间段当成永久固定规则。&lt;/p&gt;
&lt;p&gt;实用建议是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;大重构、大批量分析尽量放到自己网络和服务都稳定的时段。&lt;/li&gt;
&lt;li&gt;不要在快到休息时开启一个超长任务。&lt;/li&gt;
&lt;li&gt;预计会离开很久时，先 &lt;code&gt;/compact&lt;/code&gt; 或 &lt;code&gt;/clear&lt;/code&gt;。&lt;/li&gt;
&lt;li&gt;如果只是小改动，不要开 Opus 加长上下文硬跑。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这比记一个固定“几点到几点不能用”的规则更可靠。&lt;/p&gt;
&lt;h2 id=&#34;07-精简-claudemdrulesmcp-和-skills&#34;&gt;07 精简 CLAUDE.md、rules、MCP 和 skills
&lt;/h2&gt;&lt;p&gt;Claude Code 会在会话中加载项目规则、工具信息和一部分环境上下文。官方文档也建议把通用规则和专用规则分开，避免每次启动都带着一大包不相关内容。&lt;/p&gt;
&lt;p&gt;比较推荐的拆法：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;CLAUDE.md&lt;/code&gt;：只放全局都适用的核心规则。&lt;/li&gt;
&lt;li&gt;rules：放特定路径、特定文件类型才需要的规则。&lt;/li&gt;
&lt;li&gt;skills：放特定工作流，例如发文章、部署、生成图片、提交代码。&lt;/li&gt;
&lt;li&gt;MCP：只启用当前任务真的会用到的 server。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果 &lt;code&gt;CLAUDE.md&lt;/code&gt; 写了几百上千行，每次会话都要带进去。更好的方式是把“偶尔才用”的流程移到 skill 里，需要时再调用。&lt;/p&gt;
&lt;p&gt;MCP 也是一样。工具多不等于效率高。Claude Code 文档提到可以用 &lt;code&gt;/mcp&lt;/code&gt; 查看并禁用不需要的 server，也可以用 &lt;code&gt;/context&lt;/code&gt; 看是什么占用了上下文空间。&lt;/p&gt;
&lt;h2 id=&#34;08-实用指令清单&#34;&gt;08 实用指令清单
&lt;/h2&gt;&lt;p&gt;日常最常用的是这几个：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;/model
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;切换模型。默认建议用 Sonnet，复杂推理再用 Opus。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;/clear
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;清空当前上下文。换无关任务时用，最省。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;/compact
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;压缩历史上下文。一个阶段完成但还要继续同一任务时用。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;/context
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;查看上下文占用，排查是什么吃掉空间。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;/status
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;查看当前订阅或额度相关状态。官方帮助中心也建议用它监控剩余额度。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;/mcp
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;查看和管理 MCP server，关闭当前不用的工具。&lt;/p&gt;
&lt;p&gt;如果你用 API 计费模式，还可以关注 &lt;code&gt;/cost&lt;/code&gt;；但如果是 Pro/Max 订阅，官方文档说明 &lt;code&gt;/cost&lt;/code&gt; 的美元估算不适合作为订阅账单依据，订阅用户更应该看 &lt;code&gt;/stats&lt;/code&gt; 和 &lt;code&gt;/status&lt;/code&gt; 这类使用信息。&lt;/p&gt;
&lt;h2 id=&#34;09-一套省额度工作流&#34;&gt;09 一套省额度工作流
&lt;/h2&gt;&lt;p&gt;比较顺手的流程可以是这样：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;新任务开始前先 &lt;code&gt;/clear&lt;/code&gt;。&lt;/li&gt;
&lt;li&gt;默认用 Sonnet。&lt;/li&gt;
&lt;li&gt;先让 Claude 读项目结构和关键文件，不要一口气读全仓库。&lt;/li&gt;
&lt;li&gt;每做完一个小阶段就 &lt;code&gt;/compact&lt;/code&gt;。&lt;/li&gt;
&lt;li&gt;复杂卡点再切 Opus。&lt;/li&gt;
&lt;li&gt;日志、报错、测试输出先过滤再给。&lt;/li&gt;
&lt;li&gt;任务完成后 &lt;code&gt;/clear&lt;/code&gt;，不要拖着旧上下文开新活。&lt;/li&gt;
&lt;li&gt;定期检查 &lt;code&gt;CLAUDE.md&lt;/code&gt;、MCP 和 skills，把常驻上下文压小。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;这个流程的核心是：让 Claude 每次只看当前真正需要看的东西。&lt;/p&gt;
&lt;h2 id=&#34;10-小结&#34;&gt;10 小结
&lt;/h2&gt;&lt;p&gt;Claude Code 额度快速耗尽，通常不是单一原因，而是几个因素叠加：用了高成本模型、长对话一直不清、文件和日志塞太多、MCP 和规则常驻过重、缓存命中变差，再加上高峰容量波动。&lt;/p&gt;
&lt;p&gt;省额度的核心也很简单：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;日常任务优先 Sonnet。&lt;/li&gt;
&lt;li&gt;Opus 留给真正复杂的问题。&lt;/li&gt;
&lt;li&gt;阶段完成用 &lt;code&gt;/compact&lt;/code&gt;。&lt;/li&gt;
&lt;li&gt;换任务用 &lt;code&gt;/clear&lt;/code&gt;。&lt;/li&gt;
&lt;li&gt;用 &lt;code&gt;/context&lt;/code&gt; 找上下文占用来源。&lt;/li&gt;
&lt;li&gt;精简 &lt;code&gt;CLAUDE.md&lt;/code&gt;、rules、MCP 和 skills。&lt;/li&gt;
&lt;li&gt;不要把整仓库、整日志、整图片包都丢进去。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;同样的 Pro 或 Max 方案，能做多少事，很大程度取决于你怎么管理上下文。把上下文变小、任务边界变清楚，Claude Code 的可用时间和稳定性都会明显好很多。&lt;/p&gt;
&lt;h2 id=&#34;参考链接&#34;&gt;参考链接
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;Claude Help Center：Using Claude Code with your Pro or Max plan：&lt;a class=&#34;link&#34; href=&#34;https://support.claude.com/en/articles/11145838-using-claude-code-with-your-pro-or-max-plan&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://support.claude.com/en/articles/11145838-using-claude-code-with-your-pro-or-max-plan&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;Claude Help Center：About Claude&amp;rsquo;s Max Plan Usage：&lt;a class=&#34;link&#34; href=&#34;https://support.anthropic.com/en/articles/11014257-about-claude-s-max-plan-usage/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://support.anthropic.com/en/articles/11014257-about-claude-s-max-plan-usage/&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;Claude Code Docs：Manage costs effectively：&lt;a class=&#34;link&#34; href=&#34;https://code.claude.com/docs/en/costs&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://code.claude.com/docs/en/costs&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;Anthropic Docs：Prompt caching：&lt;a class=&#34;link&#34; href=&#34;https://docs.anthropic.com/en/docs/build-with-claude/prompt-caching&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://docs.anthropic.com/en/docs/build-with-claude/prompt-caching&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        
    </channel>
</rss>
