Google 還沒有正式發布 Gemini 3.5 Pro。
目前能看到的資訊,主要來自開發者社群截圖、匿名跑分、爆料人消息和媒體轉述。36Kr / 新智元在 2026 年 5 月 15 日整理稱,新一代 Gemini 檢查點內部代號可能是 Cappuccino,相關模型已經在社群和評測平台中提前曝光。
這類資訊還不能等同於官方發布,但它透露出一個清晰方向:Google 正在試圖同時補上兩塊短板,一塊是編程和推理能力,另一塊是全天候 AI Agent。
先說結論
這次爆料可以拆成三層來看:
Gemini 3.5 Pro尚未正式發布,Cappuccino更像是內部檢查點或候選版本代號。- 曝光資訊顯示,新 Gemini 在程式碼生成、SVG / 互動式 Web 生成、多模態輸出上有明顯提升。
- Google 同步測試的
Gemini Spark,可能比模型本身更關鍵,因為它指向 24 小時運行的個人 AI Agent。
換句話說,這不是一條簡單的「模型跑分新聞」。它更像是 Google 在 I/O 前釋放出的產品路線訊號:模型要追趕 GPT-5.5,Agent 要搶占使用者工作流入口。
Cappuccino 是什麼
36Kr 文章提到,網友 Lentils 放出的消息顯示,代號 Cappuccino 的 Gemini 3.5 Pro 檢查點已經開始產出。此前社群還在討論 Gemini 3.2,但最新曝光直接跳到了 3.5。
如果這個命名最終屬實,說明 Google 可能希望把下一代 Gemini 包裝成一次更大的版本躍遷,而不是普通小版本更新。
需要注意的是,Cappuccino 現在仍應被視為爆料中的內部代號。它不等於 Google 已經公開上線的正式模型,也不代表最終發布名一定就是 Gemini 3.5 Pro。
編程能力為什麼是焦點
這次爆料裡最受關注的點,是新 Gemini 的編程能力。
36Kr 引述的社群截圖和跑分資訊顯示,新模型在以下任務上表現更強:
- 生成 SVG 與視覺元件。
- 生成互動式 Web 應用。
- 處理動畫、3D、可調參數面板等複雜前端輸出。
- 邏輯推理和程式碼生成能力有所提升。
文章還提到,Abacus.AI CEO Bindu Reddy 轉述的說法是,3.2 Flash 在編碼和推理上接近 GPT-5.5 的水準,同時成本更低。另有媒體信源則認為,新款 Gemini 的整體性能大致追平 GPT-5.5,但未必能帶來質變。
這也是為什麼要謹慎看待「追平 GPT-5.5」這句話。它更像是不同爆料源和匿名評測中的相對判斷,而不是 Google 官方給出的基準測試結論。
為什麼 Google 急著補編程
AI 編程已經從開發者工具變成了大模型競爭的核心戰場。
OpenAI 有 Codex,Anthropic 有 Claude Code。它們不只服務工程師,也在把產品經理、設計師、營運人員帶進「自然語言生成可運行產品」的工作流裡。
相比之下,Google 雖然有 Gemini 和 Antigravity,但在開發者心智裡一直沒有形成同等強度的預設入口。36Kr 文章也提到,Antigravity 在外部市場還沒有真正突圍,定價、額度提醒和體驗穩定性都曾引發社群討論。
所以新 Gemini 如果要證明自己,編程會是最直接的戰場。它不一定只比拼「會不會寫程式碼」,還要比拼能不能穩定產出完整介面、理解複雜需求、調用工具、修復錯誤並融入真實開發流程。
Spark 可能比 3.5 Pro 更重要
同一波爆料裡,Gemini Spark BETA 也被扒出。
根據 TestingCatalog 等資訊源的說法,Spark 的定位接近「全天候 AI Agent」:它可以處理收件匣、執行線上任務、管理多步驟工作流,並連接 Google 應用、技能模組、聊天記錄、定時任務、登入網站、位置資訊等上下文。
這意味著 Spark 不是一個普通聊天入口,而是一個可能長期在線、持續讀取上下文並替使用者執行任務的系統。
它的吸引力很明顯:如果 Google 能把 Gmail、Calendar、Chrome、Android、Workspace 和 Gemini 串起來,Spark 會天然擁有 OpenAI 和 Anthropic 很難複製的分發優勢。
但風險也同樣明顯。36Kr 文章提到,Spark 相關說明中出現了「可能在未經詢問的情況下分享資訊或完成購買」的表述。哪怕系統設計上會在敏感操作前徵求許可,這類 Agent 仍然會帶來隱私、授權邊界和誤操作風險。
這對普通使用者意味著什麼
如果你只是普通 Gemini 使用者,這次爆料真正值得關注的不是模型名,而是三個變化:
第一,Google 可能會繼續強化「生成完整結果」的能力。以前使用者經常吐槽 Gemini 在視覺生成、SVG、前端頁面上容易偷懶,如果新模型能一次給出多個完整方案,體驗會明顯改善。
第二,編程能力會繼續下放到更輕量的模型。爆料裡反覆提到 Flash 版本在編碼、推理和互動式生成上的提升,這意味著未來不一定只有 Pro 模型才能處理複雜任務。
第三,Agent 會變得更主動。Spark 如果發布,Gemini 可能不再只是回答問題,而是開始長期接管郵件、網頁、購買、日程和跨應用任務。
這對效率是好消息,對權限管理則是新挑戰。
這對開發者意味著什麼
開發者更應該關注兩個問題。
第一個問題是工具生態。36Kr 文章提到,社群從模型選擇器裡看到了 MCP Tool Testing 這類未公開入口。如果 Gemini 原生支援 MCP 或第三方工具測試,那麼它會更容易接入開發者自己的工具鏈。
第二個問題是成本和穩定性。即便新 Gemini 在某些基準上追平 GPT-5.5,開發者最終還是會看三件事:實際程式碼品質、上下文穩定性、價格和額度是否可預期。
過去一年,AI 編程工具競爭已經證明,模型能力只是門票。真正讓開發者留下來的,是能不能在日常專案裡持續可靠地改程式碼、跑測試、讀上下文、處理邊界條件。
現在應該如何看待這條消息
這條消息適合用「強訊號、弱確認」來理解。
強訊號在於:多個社群線索都指向 Google 正在準備更強的新 Gemini,以及更主動的 Gemini Spark Agent。
弱確認在於:Gemini 3.5 Pro 還沒有官方發布,Cappuccino 仍是爆料代號,所謂「追平 GPT-5.5」的說法也需要等 Google 官方基準、第三方評測和真實使用者測試來驗證。
所以現在最穩妥的判斷是:
- 不要把它當成已發布產品。
- 可以把它當成 Google 下一階段 Gemini 路線的提前預告。
- 重點關注 I/O 或後續官方活動中是否會確認模型命名、API 可用性、價格、上下文窗口、工具調用和 Agent 權限邊界。
總結
Gemini 3.5 Pro / Cappuccino 的曝光說明,Google 可能正在為下一代 Gemini 做一次更強勢的版本推進。它要補的不是單一能力,而是整個 AI 工作流:模型要更會寫程式碼、生成介面和處理複雜推理,Spark 則要把 Gemini 推向全天候 Agent。
但在官方發布前,所有跑分和截圖都只能作為線索。真正決定 Gemini 3.5 Pro 能否翻身的,不是代號是否好聽,而是它能否在真實開發、真實辦公和真實多步驟任務裡穩定勝出。
參考連結: