<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>GPT-5.5 on KnightLi的博客</title>
        <link>https://www.knightli.com/zh-tw/tags/gpt-5.5/</link>
        <description>Recent content in GPT-5.5 on KnightLi的博客</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-tw</language>
        <lastBuildDate>Fri, 24 Apr 2026 08:39:56 +0800</lastBuildDate><atom:link href="https://www.knightli.com/zh-tw/tags/gpt-5.5/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>OpenAI 發布 GPT-5.5：更強的智慧體編碼、知識工作與科研能力</title>
        <link>https://www.knightli.com/zh-tw/2026/04/24/openai-gpt-5-5-release/</link>
        <pubDate>Fri, 24 Apr 2026 08:39:56 +0800</pubDate>
        
        <guid>https://www.knightli.com/zh-tw/2026/04/24/openai-gpt-5-5-release/</guid>
        <description>&lt;p&gt;OpenAI 在 2026 年 4 月 23 日發布了 &lt;a class=&#34;link&#34; href=&#34;https://openai.com/index/introducing-gpt-5-5/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Introducing GPT-5.5&lt;/a&gt;。從官方頁面來看，這次更新的重點不是單純「模型更聰明」，而是更強調模型能不能把複雜任務持續推進下去。&lt;/p&gt;
&lt;p&gt;官方給 GPT-5.5 的定位，是一個更適合真實工作的模型。它不只要回答問題，還要能寫程式、除錯、查資料、分析資料、產生文件和試算表、操作軟體，並在多個工具之間來回切換，直到任務完成。&lt;/p&gt;
&lt;h2 id=&#34;1-gpt-55-主要強在哪裡&#34;&gt;1. GPT-5.5 主要強在哪裡
&lt;/h2&gt;&lt;p&gt;這次發布頁裡反覆出現的幾個方向，可以概括為四類：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;智慧體編碼&lt;/li&gt;
&lt;li&gt;電腦操作與工具使用&lt;/li&gt;
&lt;li&gt;知識工作&lt;/li&gt;
&lt;li&gt;早期科研輔助&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;也就是說，GPT-5.5 的重點不是短問短答，而是更長鏈路的任務。例如一個工程問題不只是「這段程式碼怎麼改」，而是要理解專案結構、定位失敗原因、修改相關檔案、補測試、驗證結果，並盡量減少使用者反覆提示。&lt;/p&gt;
&lt;p&gt;OpenAI 也特別強調，GPT-5.5 在 Codex 任務中更省 token。這點很實際，因為編碼智慧體一旦開始讀檔案、跑命令、修 bug，token 消耗會非常快。如果模型能用更少步驟完成同樣任務，實際成本和等待時間都會下降。&lt;/p&gt;
&lt;h2 id=&#34;2-編碼能力是這次最重要的展示方向&#34;&gt;2. 編碼能力是這次最重要的展示方向
&lt;/h2&gt;&lt;p&gt;官方稱 GPT-5.5 是目前最強的 agentic coding 模型。&lt;/p&gt;
&lt;p&gt;幾個公開指標裡，比較值得注意的是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;Terminal-Bench 2.0&lt;/code&gt;：GPT-5.5 達到 &lt;code&gt;82.7%&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;SWE-Bench Pro&lt;/code&gt;：GPT-5.5 達到 &lt;code&gt;58.6%&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;OpenAI 內部的 &lt;code&gt;Expert-SWE&lt;/code&gt;：GPT-5.5 也高於 GPT-5.4&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;這些測試的共同點是，它們更接近真實工程流程，而不是只考單個演算法題。特別是 Terminal-Bench 這類任務，會涉及命令列操作、規劃、試錯、工具協調和多步驟驗證。&lt;/p&gt;
&lt;p&gt;對日常開發者來說，這裡的意義很直接：模型是否能接住更大的任務，取決於它能不能長時間保持上下文、自己檢查假設、知道什麼時候該跑測試、知道改動會影響哪裡。&lt;/p&gt;
&lt;p&gt;GPT-5.5 在 Codex 裡的價值，也主要體現在這些地方。它更像是可以接手一段工程任務的協作者，而不是只會補全程式碼片段的工具。&lt;/p&gt;
&lt;h2 id=&#34;3-知識工作開始變成重點場景&#34;&gt;3. 知識工作開始變成重點場景
&lt;/h2&gt;&lt;p&gt;除了寫程式，OpenAI 這次也把 GPT-5.5 放到了更廣的辦公場景裡。&lt;/p&gt;
&lt;p&gt;官方提到，GPT-5.5 在 Codex 中可以更好地產生文件、試算表和簡報，也更適合處理營運研究、試算表建模、業務材料整理這類任務。結合電腦操作能力之後，它的目標不是只給建議，而是能直接參與「找資料、理解內容、呼叫工具、檢查輸出、整理成結果」這整條流程。&lt;/p&gt;
&lt;p&gt;發布頁裡還提到 OpenAI 內部已經在多部門使用 Codex，包括軟體工程、財務、傳播、市場、資料科學和產品管理等。這裡真正值得關注的不是某個單點案例，而是 OpenAI 正在把 Codex 從開發工具擴展為通用工作工具。&lt;/p&gt;
&lt;p&gt;在 ChatGPT 裡，GPT-5.5 Thinking 面向 Plus、Pro、Business 和 Enterprise 使用者；GPT-5.5 Pro 則面向更難問題和更高準確率需求，提供給 Pro、Business 和 Enterprise 使用者。&lt;/p&gt;
&lt;h2 id=&#34;4-科研能力不只是答題更強&#34;&gt;4. 科研能力不只是「答題更強」
&lt;/h2&gt;&lt;p&gt;GPT-5.5 的科研展示也很重。&lt;/p&gt;
&lt;p&gt;官方提到它在遺傳學、定量生物學、生物資訊學、數學證明等方向都有改進。這裡的重點不是模型能不能背出一個知識點，而是能不能處理更接近真實研究的問題：讀資料、發現異常、提出分析方式、解釋結果，並根據中間結果繼續推進。&lt;/p&gt;
&lt;p&gt;發布頁裡提到的 &lt;code&gt;GeneBench&lt;/code&gt; 和 &lt;code&gt;BixBench&lt;/code&gt;，都更偏多階段科學分析任務。OpenAI 還提到，一個內部版本的 GPT-5.5 借助自訂工具鏈，幫助發現了關於 Ramsey numbers 的新證明，並用 Lean 做了驗證。&lt;/p&gt;
&lt;p&gt;這類案例還不能簡單理解為「AI 已經能獨立做科研」，但它說明模型正在從問答工具往研究協作者靠近。尤其是在程式碼、資料、論文、實驗想法混在一起的場景裡，GPT-5.5 的長鏈路推理和工具使用能力會更重要。&lt;/p&gt;
&lt;h2 id=&#34;5-推理效率更強但沒有明顯變慢&#34;&gt;5. 推理效率：更強但沒有明顯變慢
&lt;/h2&gt;&lt;p&gt;一個容易被忽略的點是，OpenAI 說 GPT-5.5 在真實服務中的 per-token latency 與 GPT-5.4 相當。&lt;/p&gt;
&lt;p&gt;通常更大的模型、更強的模型會帶來更高延遲。OpenAI 這次強調，它們透過推理系統最佳化，讓 GPT-5.5 在智慧提升的同時保持速度。發布頁裡還提到，Codex 分析生產流量模式並編寫負載分配相關啟發式演算法，使 token 產生速度提升超過 &lt;code&gt;20%&lt;/code&gt;。&lt;/p&gt;
&lt;p&gt;這個細節很有意思：模型不只被基礎設施服務，也反過來幫助改進服務它的基礎設施。&lt;/p&gt;
&lt;h2 id=&#34;6-安全策略會更嚴格尤其是網路安全方向&#34;&gt;6. 安全策略會更嚴格，尤其是網路安全方向
&lt;/h2&gt;&lt;p&gt;GPT-5.5 的網路安全能力更強，所以 OpenAI 同時加強了安全限制。&lt;/p&gt;
&lt;p&gt;官方說明中提到，GPT-5.5 在網路安全能力上比 GPT-5.4 有提升，因此會部署更嚴格的分類器，尤其針對高風險活動、敏感網路安全請求和重複濫用行為。&lt;/p&gt;
&lt;p&gt;這意味著一部分使用者在使用網路安全相關能力時，可能會遇到更多拒答或限制。OpenAI 也提供了 Trusted Access for Cyber，用於讓經過驗證的防禦性使用者獲得更少不必要阻礙。&lt;/p&gt;
&lt;p&gt;對普通開發者來說，可以簡單理解為：合法的安全加固、漏洞修復、程式碼審計會繼續被支援，但高風險攻擊鏈路會被更嚴格地控制。&lt;/p&gt;
&lt;h2 id=&#34;7-可用性與-api-價格&#34;&gt;7. 可用性與 API 價格
&lt;/h2&gt;&lt;p&gt;根據 OpenAI 發布頁，GPT-5.5 的可用性如下：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;ChatGPT：GPT-5.5 Thinking 面向 Plus、Pro、Business、Enterprise 使用者&lt;/li&gt;
&lt;li&gt;ChatGPT：GPT-5.5 Pro 面向 Pro、Business、Enterprise 使用者&lt;/li&gt;
&lt;li&gt;Codex：GPT-5.5 面向 Plus、Pro、Business、Enterprise、Edu、Go 方案&lt;/li&gt;
&lt;li&gt;Codex：上下文視窗為 &lt;code&gt;400K&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;Codex Fast mode：產生速度約 &lt;code&gt;1.5x&lt;/code&gt;，成本為 &lt;code&gt;2.5x&lt;/code&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;API 方面，OpenAI 表示 &lt;code&gt;gpt-5.5&lt;/code&gt; 和 &lt;code&gt;gpt-5.5-pro&lt;/code&gt; 會很快開放。&lt;/p&gt;
&lt;p&gt;官方給出的 API 價格是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;gpt-5.5&lt;/code&gt;：輸入 &lt;code&gt;5 美元 / 1M tokens&lt;/code&gt;，輸出 &lt;code&gt;30 美元 / 1M tokens&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;gpt-5.5-pro&lt;/code&gt;：輸入 &lt;code&gt;30 美元 / 1M tokens&lt;/code&gt;，輸出 &lt;code&gt;180 美元 / 1M tokens&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;gpt-5.5&lt;/code&gt; API 上下文視窗為 &lt;code&gt;1M&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;Batch 和 Flex 為標準 API 價格的一半&lt;/li&gt;
&lt;li&gt;Priority processing 為標準價格的 &lt;code&gt;2.5x&lt;/code&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;這個價格明顯高於很多日常模型，所以它更適合高價值任務：複雜工程改造、長文件分析、自動化辦公、科研輔助、重要業務流程，而不是普通閒聊。&lt;/p&gt;
&lt;h2 id=&#34;8-怎麼看這次發布&#34;&gt;8. 怎麼看這次發布
&lt;/h2&gt;&lt;p&gt;如果只看一句話，GPT-5.5 的重點是：OpenAI 正在把模型從「回答問題」繼續推向「完成工作」。&lt;/p&gt;
&lt;p&gt;它最值得關注的地方，不只是 benchmark 分數提升，而是幾種能力開始匯合：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;更強的長任務保持能力&lt;/li&gt;
&lt;li&gt;更穩定的工具使用&lt;/li&gt;
&lt;li&gt;更好的工程上下文理解&lt;/li&gt;
&lt;li&gt;更適合文件、試算表、研究和業務流程&lt;/li&gt;
&lt;li&gt;更長上下文和更高 token 效率&lt;/li&gt;
&lt;li&gt;更嚴格的高風險能力控制&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;對開發者來說，最值得試的是 Codex 裡的複雜工程任務。對企業使用者來說，更值得關注的是它能不能把一部分跨工具、跨文件、跨流程的工作變成可交付結果。&lt;/p&gt;
&lt;p&gt;GPT-5.5 不是一次只面向聊天體驗的小更新，而更像是 OpenAI 在繼續推進「AI 作為工作執行層」的方向。&lt;/p&gt;
&lt;h2 id=&#34;相關連結&#34;&gt;相關連結
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://openai.com/index/introducing-gpt-5-5/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Introducing GPT-5.5 - OpenAI&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        
    </channel>
</rss>
