Gemini 3.5 Pro 曝光:代號 Cappuccino,Google 想在編程和 Agent 上追回節奏

整理 36Kr / 新智元關於 Gemini 3.5 Pro 與 Gemini Spark 的爆料:代號 Cappuccino 的新模型尚未正式發布,但社群截圖、匿名跑分和媒體信源都指向 Google 正在補強編程、推理、多模態生成和全天候 Agent。

Google 還沒有正式發布 Gemini 3.5 Pro

目前能看到的資訊,主要來自開發者社群截圖、匿名跑分、爆料人消息和媒體轉述。36Kr / 新智元在 2026 年 5 月 15 日整理稱,新一代 Gemini 檢查點內部代號可能是 Cappuccino,相關模型已經在社群和評測平台中提前曝光。

這類資訊還不能等同於官方發布,但它透露出一個清晰方向:Google 正在試圖同時補上兩塊短板,一塊是編程和推理能力,另一塊是全天候 AI Agent。

先說結論

這次爆料可以拆成三層來看:

  1. Gemini 3.5 Pro 尚未正式發布,Cappuccino 更像是內部檢查點或候選版本代號。
  2. 曝光資訊顯示,新 Gemini 在程式碼生成、SVG / 互動式 Web 生成、多模態輸出上有明顯提升。
  3. Google 同步測試的 Gemini Spark,可能比模型本身更關鍵,因為它指向 24 小時運行的個人 AI Agent。

換句話說,這不是一條簡單的「模型跑分新聞」。它更像是 Google 在 I/O 前釋放出的產品路線訊號:模型要追趕 GPT-5.5,Agent 要搶占使用者工作流入口。

Cappuccino 是什麼

36Kr 文章提到,網友 Lentils 放出的消息顯示,代號 CappuccinoGemini 3.5 Pro 檢查點已經開始產出。此前社群還在討論 Gemini 3.2,但最新曝光直接跳到了 3.5

如果這個命名最終屬實,說明 Google 可能希望把下一代 Gemini 包裝成一次更大的版本躍遷,而不是普通小版本更新。

需要注意的是,Cappuccino 現在仍應被視為爆料中的內部代號。它不等於 Google 已經公開上線的正式模型,也不代表最終發布名一定就是 Gemini 3.5 Pro

編程能力為什麼是焦點

這次爆料裡最受關注的點,是新 Gemini 的編程能力。

36Kr 引述的社群截圖和跑分資訊顯示,新模型在以下任務上表現更強:

  • 生成 SVG 與視覺元件。
  • 生成互動式 Web 應用。
  • 處理動畫、3D、可調參數面板等複雜前端輸出。
  • 邏輯推理和程式碼生成能力有所提升。

文章還提到,Abacus.AI CEO Bindu Reddy 轉述的說法是,3.2 Flash 在編碼和推理上接近 GPT-5.5 的水準,同時成本更低。另有媒體信源則認為,新款 Gemini 的整體性能大致追平 GPT-5.5,但未必能帶來質變。

這也是為什麼要謹慎看待「追平 GPT-5.5」這句話。它更像是不同爆料源和匿名評測中的相對判斷,而不是 Google 官方給出的基準測試結論。

為什麼 Google 急著補編程

AI 編程已經從開發者工具變成了大模型競爭的核心戰場。

OpenAI 有 Codex,Anthropic 有 Claude Code。它們不只服務工程師,也在把產品經理、設計師、營運人員帶進「自然語言生成可運行產品」的工作流裡。

相比之下,Google 雖然有 Gemini 和 Antigravity,但在開發者心智裡一直沒有形成同等強度的預設入口。36Kr 文章也提到,Antigravity 在外部市場還沒有真正突圍,定價、額度提醒和體驗穩定性都曾引發社群討論。

所以新 Gemini 如果要證明自己,編程會是最直接的戰場。它不一定只比拼「會不會寫程式碼」,還要比拼能不能穩定產出完整介面、理解複雜需求、調用工具、修復錯誤並融入真實開發流程。

Spark 可能比 3.5 Pro 更重要

同一波爆料裡,Gemini Spark BETA 也被扒出。

根據 TestingCatalog 等資訊源的說法,Spark 的定位接近「全天候 AI Agent」:它可以處理收件匣、執行線上任務、管理多步驟工作流,並連接 Google 應用、技能模組、聊天記錄、定時任務、登入網站、位置資訊等上下文。

這意味著 Spark 不是一個普通聊天入口,而是一個可能長期在線、持續讀取上下文並替使用者執行任務的系統。

它的吸引力很明顯:如果 Google 能把 Gmail、Calendar、Chrome、Android、Workspace 和 Gemini 串起來,Spark 會天然擁有 OpenAI 和 Anthropic 很難複製的分發優勢。

但風險也同樣明顯。36Kr 文章提到,Spark 相關說明中出現了「可能在未經詢問的情況下分享資訊或完成購買」的表述。哪怕系統設計上會在敏感操作前徵求許可,這類 Agent 仍然會帶來隱私、授權邊界和誤操作風險。

這對普通使用者意味著什麼

如果你只是普通 Gemini 使用者,這次爆料真正值得關注的不是模型名,而是三個變化:

第一,Google 可能會繼續強化「生成完整結果」的能力。以前使用者經常吐槽 Gemini 在視覺生成、SVG、前端頁面上容易偷懶,如果新模型能一次給出多個完整方案,體驗會明顯改善。

第二,編程能力會繼續下放到更輕量的模型。爆料裡反覆提到 Flash 版本在編碼、推理和互動式生成上的提升,這意味著未來不一定只有 Pro 模型才能處理複雜任務。

第三,Agent 會變得更主動。Spark 如果發布,Gemini 可能不再只是回答問題,而是開始長期接管郵件、網頁、購買、日程和跨應用任務。

這對效率是好消息,對權限管理則是新挑戰。

這對開發者意味著什麼

開發者更應該關注兩個問題。

第一個問題是工具生態。36Kr 文章提到,社群從模型選擇器裡看到了 MCP Tool Testing 這類未公開入口。如果 Gemini 原生支援 MCP 或第三方工具測試,那麼它會更容易接入開發者自己的工具鏈。

第二個問題是成本和穩定性。即便新 Gemini 在某些基準上追平 GPT-5.5,開發者最終還是會看三件事:實際程式碼品質、上下文穩定性、價格和額度是否可預期。

過去一年,AI 編程工具競爭已經證明,模型能力只是門票。真正讓開發者留下來的,是能不能在日常專案裡持續可靠地改程式碼、跑測試、讀上下文、處理邊界條件。

現在應該如何看待這條消息

這條消息適合用「強訊號、弱確認」來理解。

強訊號在於:多個社群線索都指向 Google 正在準備更強的新 Gemini,以及更主動的 Gemini Spark Agent。

弱確認在於:Gemini 3.5 Pro 還沒有官方發布,Cappuccino 仍是爆料代號,所謂「追平 GPT-5.5」的說法也需要等 Google 官方基準、第三方評測和真實使用者測試來驗證。

所以現在最穩妥的判斷是:

  • 不要把它當成已發布產品。
  • 可以把它當成 Google 下一階段 Gemini 路線的提前預告。
  • 重點關注 I/O 或後續官方活動中是否會確認模型命名、API 可用性、價格、上下文窗口、工具調用和 Agent 權限邊界。

總結

Gemini 3.5 Pro / Cappuccino 的曝光說明,Google 可能正在為下一代 Gemini 做一次更強勢的版本推進。它要補的不是單一能力,而是整個 AI 工作流:模型要更會寫程式碼、生成介面和處理複雜推理,Spark 則要把 Gemini 推向全天候 Agent。

但在官方發布前,所有跑分和截圖都只能作為線索。真正決定 Gemini 3.5 Pro 能否翻身的,不是代號是否好聽,而是它能否在真實開發、真實辦公和真實多步驟任務裡穩定勝出。

參考連結:

记录并分享
使用 Hugo 建立
主題 StackJimmy 設計