<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>GPT-5.4 on KnightLi的博客</title>
        <link>https://www.knightli.com/tags/gpt-5.4/</link>
        <description>Recent content in GPT-5.4 on KnightLi的博客</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-cn</language>
        <lastBuildDate>Sun, 10 May 2026 08:43:17 +0800</lastBuildDate><atom:link href="https://www.knightli.com/tags/gpt-5.4/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>GPT-5.5、GPT-5.4 与 GPT-5.3-Codex 如何取舍</title>
        <link>https://www.knightli.com/2026/05/10/gpt-5-5-vs-gpt-5-4-vs-gpt-5-3-codex/</link>
        <pubDate>Sun, 10 May 2026 08:43:17 +0800</pubDate>
        
        <guid>https://www.knightli.com/2026/05/10/gpt-5-5-vs-gpt-5-4-vs-gpt-5-3-codex/</guid>
        <description>&lt;p&gt;如果只看一句话，结论其实很直接：默认选 &lt;code&gt;GPT-5.5&lt;/code&gt;，预算更敏感或任务难度中等时选 &lt;code&gt;GPT-5.4&lt;/code&gt;，只有在 Codex 环境里做更长时间的软件工程任务，或者需要 Cloud Tasks、Code Review 这类能力时，再重点看 &lt;code&gt;GPT-5.3-Codex&lt;/code&gt;。&lt;/p&gt;
&lt;p&gt;这个判断不只是主观体验，OpenAI 在 Codex 官方文档里的推荐也已经比较明确。到 &lt;code&gt;2026-05-10&lt;/code&gt; 为止，Codex 文档仍然写着：大多数任务优先从 &lt;code&gt;gpt-5.5&lt;/code&gt; 开始；如果还没有开放 &lt;code&gt;gpt-5.5&lt;/code&gt;，继续用 &lt;code&gt;gpt-5.4&lt;/code&gt;；轻量任务或子任务则更适合 &lt;code&gt;gpt-5.4-mini&lt;/code&gt;。&lt;/p&gt;
&lt;h2 id=&#34;三个模型的定位差异&#34;&gt;三个模型的定位差异
&lt;/h2&gt;&lt;p&gt;先看官方定位。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt; 是 Codex 里的最新前沿模型，面向复杂编程、电脑操作、知识工作和研究型工作流。它更像“默认主力模型”，适合复杂分析、多步任务、跨文件修改、方案设计和较重的文档工作。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt; 则是一个更稳的全能型选择。官方描述是：它把 &lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 的强代码能力带到了更强的推理、工具使用和 agentic workflow 里。换句话说，它不是“弱化版 5.5”，而是一个更均衡、更容易长期当主力的模型。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 仍然是很强的代码模型，但它的核心优势更集中在真实软件工程和 Codex 原生工作流里。官方文档还专门说明：它是面向 agentic coding tasks 优化的模型，而且 &lt;code&gt;GPT-5.4&lt;/code&gt; 的编码能力本身就已经继承了它的长处。&lt;/p&gt;
&lt;p&gt;所以今天再选模型，不太适合把 &lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 直接理解成“最强编程模型”。在大部分日常开发场景里，更推荐先看 &lt;code&gt;GPT-5.5&lt;/code&gt; 和 &lt;code&gt;GPT-5.4&lt;/code&gt;。&lt;/p&gt;
&lt;h2 id=&#34;按使用场景怎么选&#34;&gt;按使用场景怎么选
&lt;/h2&gt;&lt;p&gt;如果你的任务是日常问答、复杂解释、资料整理、文件分析、长文信息综合，&lt;code&gt;GPT-5.5&lt;/code&gt; 最合适。它不仅适合写代码，也更适合处理“代码之外但又很费脑子”的知识工作。&lt;/p&gt;
&lt;p&gt;如果你的任务是复杂编程、重构、排错、架构设计、多文件修改，仍然优先 &lt;code&gt;GPT-5.5&lt;/code&gt;。Codex 官方推荐也是这样写的：在能用 &lt;code&gt;gpt-5.5&lt;/code&gt; 的地方，大多数任务先从它开始。&lt;/p&gt;
&lt;p&gt;如果你更在意额度和消耗，希望在质量很高的前提下把成本压下来，&lt;code&gt;GPT-5.4&lt;/code&gt; 往往是更合理的默认值。对很多常规开发、普通改写、一般翻译、脚本生成和 bug 修复任务来说，&lt;code&gt;GPT-5.4&lt;/code&gt; 已经足够强，而且更省额度。&lt;/p&gt;
&lt;p&gt;如果你是在 Codex CLI、IDE 扩展或 App 里做更像“工程代理”的事情，比如长时间读仓库、持续改代码、排队跑任务、做 Cloud Tasks 或 Code Review，&lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 仍然有存在感。原因不是它比 &lt;code&gt;GPT-5.5&lt;/code&gt; 更先进，而是当前 Codex 的 Cloud Tasks 和 Code Review 仍然运行在 &lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 上，这决定了它在工程流里还没有退场。&lt;/p&gt;
&lt;h2 id=&#34;消耗额度差多少&#34;&gt;消耗额度差多少
&lt;/h2&gt;&lt;p&gt;在 Codex 的 credits 计费表里，这三个模型的差异非常清楚。&lt;/p&gt;
&lt;p&gt;按 Business / New Enterprise 的 token 计费口径看：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：输入 &lt;code&gt;125 credits / 1M tokens&lt;/code&gt;，缓存输入 &lt;code&gt;12.5 credits&lt;/code&gt;，输出 &lt;code&gt;750 credits&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：输入 &lt;code&gt;62.5 credits / 1M tokens&lt;/code&gt;，缓存输入 &lt;code&gt;6.25 credits&lt;/code&gt;，输出 &lt;code&gt;375 credits&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：输入 &lt;code&gt;43.75 credits / 1M tokens&lt;/code&gt;，缓存输入 &lt;code&gt;4.375 credits&lt;/code&gt;，输出 &lt;code&gt;350 credits&lt;/code&gt;&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;这意味着，按名义费率看，&lt;code&gt;GPT-5.4&lt;/code&gt; 大约是 &lt;code&gt;GPT-5.5&lt;/code&gt; 的一半，做同样长度的输入输出时，通常能省接近 &lt;code&gt;50%&lt;/code&gt; 的额度。&lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 的输入更便宜，但输出已经和 &lt;code&gt;GPT-5.4&lt;/code&gt; 很接近，所以它并不是那种“明显更便宜很多”的选择。&lt;/p&gt;
&lt;p&gt;还有一个容易忽略的点：Codex 官方又特别写了一句，&lt;code&gt;GPT-5.5 uses significantly fewer tokens to achieve results comparable to GPT-5.4&lt;/code&gt;。也就是说，虽然它的单价更高，但在某些复杂任务里，可能会靠更少的 token 和更少返工把差距拉回来。&lt;/p&gt;
&lt;p&gt;不过对固定模板文章改写、翻译、SEO 描述生成这种输入输出长度都比较稳定的任务来说，这种“少走弯路”的优势通常没有复杂工程任务那么明显。实际消耗上，&lt;code&gt;GPT-5.4&lt;/code&gt; 大多还是更省，通常可以理解为省掉大约 &lt;code&gt;45%&lt;/code&gt; 到 &lt;code&gt;50%&lt;/code&gt;。&lt;/p&gt;
&lt;h2 id=&#34;codex-使用限制上的区别&#34;&gt;Codex 使用限制上的区别
&lt;/h2&gt;&lt;p&gt;除了单价，Codex 里的可用方式也不一样。&lt;/p&gt;
&lt;p&gt;截至 &lt;code&gt;2026-05-10&lt;/code&gt;，&lt;code&gt;GPT-5.5&lt;/code&gt; 在 Codex 里是推荐模型，但目前只在使用 ChatGPT 登录的 Codex 中提供，不支持 API key 鉴权。&lt;code&gt;GPT-5.4&lt;/code&gt; 和 &lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 则支持 API 访问。&lt;/p&gt;
&lt;p&gt;另外，&lt;code&gt;GPT-5.5&lt;/code&gt; 和 &lt;code&gt;GPT-5.4&lt;/code&gt; 目前都不支持 Codex Cloud Tasks 和 Code Review；这两项仍然是 &lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 的主场。也就是说，如果你说的是“在 Codex 里长时间跑工程任务”，那就不能只看模型本身强不强，还要看对应功能是不是只有 &lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 才能跑。&lt;/p&gt;
&lt;p&gt;如果你只是本地消息使用，Plus 计划下官方给出的 5 小时窗口大致是：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：&lt;code&gt;15-80&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：&lt;code&gt;20-100&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：&lt;code&gt;30-150&lt;/code&gt;&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;从这里也能看出一个现实差异：&lt;code&gt;GPT-5.5&lt;/code&gt; 最强，但在固定额度下可用次数通常更少；&lt;code&gt;GPT-5.4&lt;/code&gt; 更均衡；&lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 在本地消息上反而看起来更耐用一些。&lt;/p&gt;
&lt;h2 id=&#34;常用场景怎么选&#34;&gt;常用场景怎么选
&lt;/h2&gt;&lt;p&gt;日常使用里有不少高频任务。更实用的看法，不是抽象地说“哪个更强”，而是按场景一个一个拆开看。&lt;/p&gt;
&lt;h3 id=&#34;1-日常问答资料整理长文总结&#34;&gt;1. 日常问答、资料整理、长文总结
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：最适合。它更擅长处理模糊问题、补齐上下文、把零散信息整理成结构化结果。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：适合普通总结和批量整理。难度不高、数量很多时，通常更划算。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：不太适合当主力。能做，但这不是它最有优势的场景。&lt;/p&gt;
&lt;h3 id=&#34;2-技术概念解释代码讲解读旧项目&#34;&gt;2. 技术概念解释、代码讲解、读旧项目
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：适合复杂项目。跨文件关系多、调用链长、历史包袱重时更稳。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：适合常规阅读理解。看函数、看模块、解释配置、帮你快速接手项目都很好用。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：更偏工程执行，不是最优先的“讲解型模型”。&lt;/p&gt;
&lt;h3 id=&#34;3-写脚本小工具sqlshell正则&#34;&gt;3. 写脚本、小工具、SQL、Shell、正则
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：适合脚本背后还有系统设计、联动多个服务、涉及复杂约束的情况。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：最适合当默认主力。大多数脚本、小工具、SQL 和命令行任务都够用，而且更省额度。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：如果脚本只是整个工程代理链条的一部分，可以考虑；单独写小脚本时不必优先选它。&lt;/p&gt;
&lt;h3 id=&#34;4-改-bug改小功能补测试普通开发&#34;&gt;4. 改 bug、改小功能、补测试、普通开发
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：适合稍复杂的修复，比如需要先分析原因、再跨文件修改、最后补测试。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：最适合日常开发主力。普通 bug、小功能、测试样板、重命名、格式整理这类任务，性价比最好。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：能做，但如果没有 Cloud Tasks 或工程代理需求，通常不是第一选择。&lt;/p&gt;
&lt;h3 id=&#34;5-复杂重构架构设计疑难排错&#34;&gt;5. 复杂重构、架构设计、疑难排错
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：最适合。复杂任务里最贵的是返工，不是单次输出；&lt;code&gt;GPT-5.5&lt;/code&gt; 更适合做主解题模型。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：适合中等复杂度任务。可以做方案和重构，但在特别长的上下文、多步推理和高不确定性问题上通常不如 &lt;code&gt;GPT-5.5&lt;/code&gt; 稳。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：偏执行，不是这类高难决策任务的默认优先级。&lt;/p&gt;
&lt;h3 id=&#34;6-批量轻任务重复任务拆子任务&#34;&gt;6. 批量轻任务、重复任务、拆子任务
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：能做，但通常不划算。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：最适合。批量改注释、批量改格式、批量生成样板代码、批量改内容时，最平衡。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：如果任务已经放进 Codex 的工程流程里，可以考虑；单看性价比，仍然通常不如 &lt;code&gt;GPT-5.4&lt;/code&gt;。&lt;/p&gt;
&lt;h3 id=&#34;7-自动化流水线代理执行持续读写仓库&#34;&gt;7. 自动化流水线、代理执行、持续读写仓库
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：适合做前期方案设计、规则制定、复杂任务拆分。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：适合写自动化脚本、补中等复杂度流程逻辑，尤其是在 API 可接入的情况下。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：最值得关注。因为 Codex 的 Cloud Tasks 和 Code Review 还运行在它上面，所以它更适合“让系统自己跑”的工程场景。&lt;/p&gt;
&lt;h3 id=&#34;8-重要页面文案品牌介绍最终润色&#34;&gt;8. 重要页面文案、品牌介绍、最终润色
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：最适合。自然度、风格控制、上下文一致性最好。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：适合大多数普通页面和日常更新，重要页面可以先写初稿再交给 &lt;code&gt;GPT-5.5&lt;/code&gt; 精修。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：不适合当主要文案模型。&lt;/p&gt;
&lt;h3 id=&#34;9-网站固定模板文章改写翻译seo-描述&#34;&gt;9. 网站固定模板文章改写、翻译、SEO 描述
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：适合做模板设计、最终润色、重要页面定稿，以及把中文翻成更自然的英文。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：最适合批量生产。普通文章改写、固定结构翻译、商品文案重写、Meta 描述批量生成，通常质量和成本最平衡。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：不适合当主要文案模型，更适合写批处理脚本、清洗 HTML、保留标签结构、改自动发布流程。&lt;/p&gt;
&lt;h3 id=&#34;10-电商商品文案分类页批量内容运营&#34;&gt;10. 电商商品文案、分类页、批量内容运营
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：适合定规则、做抽检、做高价值页面的最终润色。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：最适合批量生产。商品标题、分类页说明、批量活动文案、长尾 SEO 内容这类任务上，质量和成本更平衡。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：适合写抓取、清洗、批处理、自动发布脚本，不适合负责主要文案。&lt;/p&gt;
&lt;p&gt;如果把这些场景进一步压缩成一句话：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;复杂脑力活、复杂分析、复杂文案：优先 &lt;code&gt;GPT-5.5&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;日常开发、批量生产、重复任务：优先 &lt;code&gt;GPT-5.4&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;Codex 工程代理、Cloud Tasks、Code Review：重点看 &lt;code&gt;GPT-5.3-Codex&lt;/code&gt;&lt;/li&gt;
&lt;/ol&gt;
&lt;h2 id=&#34;最后怎么取舍&#34;&gt;最后怎么取舍
&lt;/h2&gt;&lt;p&gt;如果你只是平时写代码、改 bug、问技术问题、顺手做一些文档工作，&lt;code&gt;GPT-5.4&lt;/code&gt; 是很稳的主力选择。&lt;/p&gt;
&lt;p&gt;如果你要做的是更复杂的项目分析、多文件修改、架构方案、深度排错，或者希望一个模型同时覆盖编程和复杂知识工作，直接优先 &lt;code&gt;GPT-5.5&lt;/code&gt;。&lt;/p&gt;
&lt;p&gt;如果你在 Codex 环境里看重的是工程工作流本身，比如 Cloud Tasks、Code Review、长时间代理执行，那么 &lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 仍然值得保留，但它已经不太适合被当成“默认第一选择”。&lt;/p&gt;
&lt;p&gt;对固定模板文章站来说，更实用的搭配通常是：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;code&gt;GPT-5.4&lt;/code&gt; 负责批量生产&lt;/li&gt;
&lt;li&gt;&lt;code&gt;GPT-5.5&lt;/code&gt; 负责定模板、做抽检、做最终润色&lt;/li&gt;
&lt;li&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 负责写自动化工具，而不是负责主要文案&lt;/li&gt;
&lt;/ol&gt;
&lt;h2 id=&#34;小结&#34;&gt;小结
&lt;/h2&gt;&lt;p&gt;现在更合理的默认顺序是：&lt;code&gt;GPT-5.5&lt;/code&gt; 第一，&lt;code&gt;GPT-5.4&lt;/code&gt; 第二，&lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 放到更偏工程代理和 Codex 特定能力的场景里使用。&lt;/p&gt;
&lt;p&gt;如果你问的是“同样一篇模板文章改写，&lt;code&gt;GPT-5.4&lt;/code&gt; 比 &lt;code&gt;GPT-5.5&lt;/code&gt; 能省多少”，按官方 credits 表和这类任务的典型 token 结构看，通常可以按“省接近一半”来理解。对批量站内容来说，这个差距已经足够大，所以最常见的做法不是全程上 &lt;code&gt;GPT-5.5&lt;/code&gt;，而是先用 &lt;code&gt;GPT-5.5&lt;/code&gt; 把规则和风格定好，再把大批量任务交给 &lt;code&gt;GPT-5.4&lt;/code&gt;。&lt;/p&gt;
</description>
        </item>
        
    </channel>
</rss>
