<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>GPT-5.4 on KnightLi的博客</title>
        <link>https://www.knightli.com/zh-tw/tags/gpt-5.4/</link>
        <description>Recent content in GPT-5.4 on KnightLi的博客</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-tw</language>
        <lastBuildDate>Sun, 10 May 2026 08:43:17 +0800</lastBuildDate><atom:link href="https://www.knightli.com/zh-tw/tags/gpt-5.4/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>GPT-5.5、GPT-5.4 與 GPT-5.3-Codex 如何取捨</title>
        <link>https://www.knightli.com/zh-tw/2026/05/10/gpt-5-5-vs-gpt-5-4-vs-gpt-5-3-codex/</link>
        <pubDate>Sun, 10 May 2026 08:43:17 +0800</pubDate>
        
        <guid>https://www.knightli.com/zh-tw/2026/05/10/gpt-5-5-vs-gpt-5-4-vs-gpt-5-3-codex/</guid>
        <description>&lt;p&gt;如果只看一句話，結論其實很直接：預設選 &lt;code&gt;GPT-5.5&lt;/code&gt;，預算更敏感或任務難度中等時選 &lt;code&gt;GPT-5.4&lt;/code&gt;，只有在 Codex 環境裡做更長時間的軟體工程任務，或需要 Cloud Tasks、Code Review 這類能力時，再重點看 &lt;code&gt;GPT-5.3-Codex&lt;/code&gt;。&lt;/p&gt;
&lt;p&gt;這個判斷不只是主觀體驗，OpenAI 在 Codex 官方文件裡的推薦也已經很明確。到 &lt;code&gt;2026-05-10&lt;/code&gt; 為止，Codex 文件仍然寫著：大多數任務優先從 &lt;code&gt;gpt-5.5&lt;/code&gt; 開始；如果還沒有開放 &lt;code&gt;gpt-5.5&lt;/code&gt;，就繼續用 &lt;code&gt;gpt-5.4&lt;/code&gt;；輕量任務或子任務則更適合 &lt;code&gt;gpt-5.4-mini&lt;/code&gt;。&lt;/p&gt;
&lt;h2 id=&#34;三個模型的定位差異&#34;&gt;三個模型的定位差異
&lt;/h2&gt;&lt;p&gt;先看官方定位。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt; 是 Codex 裡最新的前沿模型，面向複雜編程、電腦操作、知識工作與研究型工作流。它更像是「預設主力模型」，適合複雜分析、多步任務、跨檔案修改、方案設計與較重的文件工作。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt; 則是一個更穩的全能型選擇。官方描述是：它把 &lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 的強程式能力帶到了更強的推理、工具使用與 agentic workflow 裡。換句話說，它不是「弱化版 5.5」，而是一個更均衡、更容易長期當主力的模型。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 仍然是很強的程式模型，但它的核心優勢更集中在真實軟體工程與 Codex 原生工作流裡。官方文件也特別說明：它是針對 agentic coding tasks 最佳化的模型，而且 &lt;code&gt;GPT-5.4&lt;/code&gt; 的編碼能力本身就已經繼承了它的長處。&lt;/p&gt;
&lt;p&gt;所以今天再選模型，不太適合把 &lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 直接理解成「最強編程模型」。在大部分日常開發場景裡，更推薦先看 &lt;code&gt;GPT-5.5&lt;/code&gt; 和 &lt;code&gt;GPT-5.4&lt;/code&gt;。&lt;/p&gt;
&lt;h2 id=&#34;按使用場景怎麼選&#34;&gt;按使用場景怎麼選
&lt;/h2&gt;&lt;p&gt;如果你的任務是日常問答、複雜解釋、資料整理、檔案分析、長文資訊綜合，&lt;code&gt;GPT-5.5&lt;/code&gt; 最合適。它不只適合寫程式，也更適合處理「程式之外但又很費腦力」的知識工作。&lt;/p&gt;
&lt;p&gt;如果你的任務是複雜編程、重構、排錯、架構設計、多檔案修改，仍然優先 &lt;code&gt;GPT-5.5&lt;/code&gt;。Codex 官方推薦也是這樣寫的：在能用 &lt;code&gt;gpt-5.5&lt;/code&gt; 的地方，大多數任務先從它開始。&lt;/p&gt;
&lt;p&gt;如果你更在意額度與消耗，希望在品質很高的前提下把成本壓下來，&lt;code&gt;GPT-5.4&lt;/code&gt; 往往是更合理的預設值。對很多常規開發、普通改寫、一般翻譯、腳本生成與 bug 修復任務來說，&lt;code&gt;GPT-5.4&lt;/code&gt; 已經足夠強，而且更省額度。&lt;/p&gt;
&lt;p&gt;如果你是在 Codex CLI、IDE 擴充套件或 App 裡做更像「工程代理」的事情，例如長時間讀倉庫、持續改程式、排隊跑任務、做 Cloud Tasks 或 Code Review，&lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 仍然有存在感。原因不是它比 &lt;code&gt;GPT-5.5&lt;/code&gt; 更先進，而是目前 Codex 的 Cloud Tasks 和 Code Review 仍然執行在 &lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 上。&lt;/p&gt;
&lt;h2 id=&#34;消耗額度差多少&#34;&gt;消耗額度差多少
&lt;/h2&gt;&lt;p&gt;在 Codex 的 credits 計費表裡，這三個模型的差異非常清楚。&lt;/p&gt;
&lt;p&gt;按 Business / New Enterprise 的 token 計費口徑看：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：輸入 &lt;code&gt;125 credits / 1M tokens&lt;/code&gt;，快取輸入 &lt;code&gt;12.5 credits&lt;/code&gt;，輸出 &lt;code&gt;750 credits&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：輸入 &lt;code&gt;62.5 credits / 1M tokens&lt;/code&gt;，快取輸入 &lt;code&gt;6.25 credits&lt;/code&gt;，輸出 &lt;code&gt;375 credits&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：輸入 &lt;code&gt;43.75 credits / 1M tokens&lt;/code&gt;，快取輸入 &lt;code&gt;4.375 credits&lt;/code&gt;，輸出 &lt;code&gt;350 credits&lt;/code&gt;&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;這代表如果只看名義費率，&lt;code&gt;GPT-5.4&lt;/code&gt; 大約是 &lt;code&gt;GPT-5.5&lt;/code&gt; 的一半。做同樣長度的輸入輸出時，通常能省接近 &lt;code&gt;50%&lt;/code&gt; 的額度。&lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 的輸入更便宜，但輸出已經和 &lt;code&gt;GPT-5.4&lt;/code&gt; 很接近，所以它並不是那種「明顯便宜很多」的選項。&lt;/p&gt;
&lt;p&gt;還有一個容易忽略的點：Codex 官方又特別寫了一句，&lt;code&gt;GPT-5.5 uses significantly fewer tokens to achieve results comparable to GPT-5.4&lt;/code&gt;。也就是說，雖然它的單價更高，但在某些複雜任務裡，可能會靠更少的 token 和更少返工把差距拉回來。&lt;/p&gt;
&lt;p&gt;不過對固定模板文章改寫、翻譯、SEO 描述生成這種輸入輸出長度都比較穩定的任務來說，這種「少走彎路」的優勢通常沒有複雜工程任務那麼明顯。實際消耗上，&lt;code&gt;GPT-5.4&lt;/code&gt; 大多還是更省，通常可以理解成省掉大約 &lt;code&gt;45%&lt;/code&gt; 到 &lt;code&gt;50%&lt;/code&gt;。&lt;/p&gt;
&lt;h2 id=&#34;codex-使用限制上的差異&#34;&gt;Codex 使用限制上的差異
&lt;/h2&gt;&lt;p&gt;除了單價，Codex 裡的可用方式也不一樣。&lt;/p&gt;
&lt;p&gt;截至 &lt;code&gt;2026-05-10&lt;/code&gt;，&lt;code&gt;GPT-5.5&lt;/code&gt; 在 Codex 裡是推薦模型，但目前只在使用 ChatGPT 登入的 Codex 中提供，不支援 API key 驗證。&lt;code&gt;GPT-5.4&lt;/code&gt; 和 &lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 則支援 API 存取。&lt;/p&gt;
&lt;p&gt;另外，&lt;code&gt;GPT-5.5&lt;/code&gt; 和 &lt;code&gt;GPT-5.4&lt;/code&gt; 目前都不支援 Codex Cloud Tasks 和 Code Review；這兩項仍然是 &lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 的主場。也就是說，如果你說的是「在 Codex 裡長時間跑工程任務」，那就不能只看模型本身強不強，還要看對應功能是不是只有 &lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 才能跑。&lt;/p&gt;
&lt;p&gt;如果你只是本地訊息使用，Plus 方案下官方給出的 5 小時窗口大致是：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：&lt;code&gt;15-80&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：&lt;code&gt;20-100&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：&lt;code&gt;30-150&lt;/code&gt;&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;從這裡也能看出一個現實差異：&lt;code&gt;GPT-5.5&lt;/code&gt; 最強，但在固定額度下可用次數通常更少；&lt;code&gt;GPT-5.4&lt;/code&gt; 更均衡；&lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 在本地訊息上反而看起來更耐用一些。&lt;/p&gt;
&lt;h2 id=&#34;常用場景怎麼選&#34;&gt;常用場景怎麼選
&lt;/h2&gt;&lt;p&gt;日常使用裡有不少高頻任務。更實用的看法，不是抽象地說「哪個更強」，而是按場景一個一個拆開看。&lt;/p&gt;
&lt;h3 id=&#34;1-日常問答資料整理長文總結&#34;&gt;1. 日常問答、資料整理、長文總結
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：最適合。它更擅長處理模糊問題、補齊上下文，把零散資訊整理成結構化結果。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：適合普通總結與批量整理。難度不高、數量很多時，通常更划算。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：不太適合當主力。能做，但這不是它最有優勢的場景。&lt;/p&gt;
&lt;h3 id=&#34;2-技術概念解釋程式講解讀舊專案&#34;&gt;2. 技術概念解釋、程式講解、讀舊專案
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：適合複雜專案。跨檔案關係多、呼叫鏈長、歷史包袱重時更穩。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：適合常規閱讀理解。看函式、看模組、解釋設定、幫你快速接手專案都很好用。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：更偏工程執行，不是最優先的「講解型模型」。&lt;/p&gt;
&lt;h3 id=&#34;3-寫腳本小工具sqlshell正則&#34;&gt;3. 寫腳本、小工具、SQL、Shell、正則
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：適合腳本背後還有系統設計、聯動多個服務、涉及複雜約束的情況。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：最適合當預設主力。大多數腳本、小工具、SQL 與命令列任務都夠用，而且更省額度。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：如果腳本只是整個工程代理鏈條的一部分，可以考慮；單獨寫小腳本時不必優先選它。&lt;/p&gt;
&lt;h3 id=&#34;4-改-bug改小功能補測試普通開發&#34;&gt;4. 改 bug、改小功能、補測試、普通開發
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：適合稍複雜的修復，例如需要先分析原因，再跨檔案修改，最後補測試。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：最適合日常開發主力。普通 bug、小功能、測試樣板、重新命名、格式整理這類任務，性價比最好。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：能做，但如果沒有 Cloud Tasks 或工程代理需求，通常不是第一選擇。&lt;/p&gt;
&lt;h3 id=&#34;5-複雜重構架構設計疑難排錯&#34;&gt;5. 複雜重構、架構設計、疑難排錯
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：最適合。複雜任務裡最貴的是返工，不是單次輸出；&lt;code&gt;GPT-5.5&lt;/code&gt; 更適合做主解題模型。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：適合中等複雜度任務。可以做方案和重構，但在特別長的上下文、多步推理與高不確定性問題上通常不如 &lt;code&gt;GPT-5.5&lt;/code&gt; 穩。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：偏執行，不是這類高難決策任務的預設優先級。&lt;/p&gt;
&lt;h3 id=&#34;6-批量輕任務重複任務拆子任務&#34;&gt;6. 批量輕任務、重複任務、拆子任務
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：能做，但通常不划算。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：最適合。批量改註釋、批量改格式、批量生成樣板程式碼、批量改內容時，最平衡。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：如果任務已經放進 Codex 的工程流程裡，可以考慮；單看性價比，仍然通常不如 &lt;code&gt;GPT-5.4&lt;/code&gt;。&lt;/p&gt;
&lt;h3 id=&#34;7-自動化流水線代理執行持續讀寫倉庫&#34;&gt;7. 自動化流水線、代理執行、持續讀寫倉庫
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：適合做前期方案設計、規則制定與複雜任務拆分。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：適合寫自動化腳本、補中等複雜度流程邏輯，尤其是在 API 可接入的情況下。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：最值得關注。因為 Codex 的 Cloud Tasks 和 Code Review 還執行在它上面，所以它更適合「讓系統自己跑」的工程場景。&lt;/p&gt;
&lt;h3 id=&#34;8-重要頁面文案品牌介紹最終潤飾&#34;&gt;8. 重要頁面文案、品牌介紹、最終潤飾
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：最適合。自然度、風格控制與上下文一致性最好。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：適合大多數普通頁面和日常更新，重要頁面可以先寫初稿再交給 &lt;code&gt;GPT-5.5&lt;/code&gt; 精修。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：不適合當主要文案模型。&lt;/p&gt;
&lt;h3 id=&#34;9-網站固定模板文章改寫翻譯seo-描述&#34;&gt;9. 網站固定模板文章改寫、翻譯、SEO 描述
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：適合做模板設計、最終潤飾、重要頁面定稿，以及把中文翻成更自然的英文。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：最適合批量生產。普通文章改寫、固定結構翻譯、商品文案重寫、Meta 描述批量生成，通常品質和成本最平衡。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：不適合當主要文案模型，更適合寫批次處理腳本、清洗 HTML、保留標籤結構、改自動發布流程。&lt;/p&gt;
&lt;h3 id=&#34;10-電商商品文案分類頁批量內容營運&#34;&gt;10. 電商商品文案、分類頁、批量內容營運
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：適合定規則、做抽檢、做高價值頁面的最終潤飾。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.4&lt;/code&gt;：最適合批量生產。商品標題、分類頁說明、批量活動文案、長尾 SEO 內容這類任務上，品質和成本更平衡。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt;：適合寫抓取、清洗、批次處理、自動發布腳本，不適合負責主要文案。&lt;/p&gt;
&lt;p&gt;如果把這些場景再壓縮成一句話：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;複雜腦力活、複雜分析、複雜文案：優先 &lt;code&gt;GPT-5.5&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;日常開發、批量生產、重複任務：優先 &lt;code&gt;GPT-5.4&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;Codex 工程代理、Cloud Tasks、Code Review：重點看 &lt;code&gt;GPT-5.3-Codex&lt;/code&gt;&lt;/li&gt;
&lt;/ol&gt;
&lt;h2 id=&#34;最後怎麼取捨&#34;&gt;最後怎麼取捨
&lt;/h2&gt;&lt;p&gt;如果你只是平時寫程式、改 bug、問技術問題、順手做一些文件工作，&lt;code&gt;GPT-5.4&lt;/code&gt; 是很穩的主力選擇。&lt;/p&gt;
&lt;p&gt;如果你要做的是更複雜的專案分析、多檔案修改、架構方案、深度排錯，或希望一個模型同時覆蓋編程與複雜知識工作，直接優先 &lt;code&gt;GPT-5.5&lt;/code&gt;。&lt;/p&gt;
&lt;p&gt;如果你在 Codex 環境裡看重的是工程工作流本身，例如 Cloud Tasks、Code Review、長時間代理執行，那麼 &lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 仍然值得保留，但它已經不太適合被當成「預設第一選擇」。&lt;/p&gt;
&lt;p&gt;對固定模板內容站來說，更實用的搭配通常是：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;code&gt;GPT-5.4&lt;/code&gt; 負責批量生產&lt;/li&gt;
&lt;li&gt;&lt;code&gt;GPT-5.5&lt;/code&gt; 負責定模板、做抽檢、做最終潤飾&lt;/li&gt;
&lt;li&gt;&lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 負責寫自動化工具，而不是負責主要內容&lt;/li&gt;
&lt;/ol&gt;
&lt;h2 id=&#34;小結&#34;&gt;小結
&lt;/h2&gt;&lt;p&gt;現在更合理的預設順序是：&lt;code&gt;GPT-5.5&lt;/code&gt; 第一，&lt;code&gt;GPT-5.4&lt;/code&gt; 第二，&lt;code&gt;GPT-5.3-Codex&lt;/code&gt; 放到更偏工程代理與 Codex 特定能力的場景裡使用。&lt;/p&gt;
&lt;p&gt;如果你問的是「同樣一篇模板文章改寫，&lt;code&gt;GPT-5.4&lt;/code&gt; 比 &lt;code&gt;GPT-5.5&lt;/code&gt; 能省多少」，按官方 credits 表和這類任務的典型 token 結構看，通常可以按「省接近一半」來理解。對批量站內容來說，這個差距已經夠大，所以最常見的做法不是全程上 &lt;code&gt;GPT-5.5&lt;/code&gt;，而是先用 &lt;code&gt;GPT-5.5&lt;/code&gt; 把規則與風格定好，再把大批量任務交給 &lt;code&gt;GPT-5.4&lt;/code&gt;。&lt;/p&gt;
</description>
        </item>
        
    </channel>
</rss>
