Gemini 3.5 Pro 提前曝光：Google 想用 Spark Agent 搶回 AI 編程入口

Fri, 15 May 2026 23:45:34 +0800

Gemini 3.5 Pro 還沒正式發布，相關爆料已經開始升溫。

這輪資訊裡有幾個關鍵詞：Gemini 3.5 Pro、代號 Cappuccino、Gemini Spark、AI 編程、MCP 工具接入。它們指向同一個方向：Google 不只是想更新一個聊天模型，而是想把模型、工具、Agent 和 Google 生態入口重新綁在一起。

不過，在正式發布前，這些資訊都應該按「爆料」看待。真正值得關注的不是某一張截圖或某一個跑分，而是 Google 接下來可能要補的幾塊短板。

Gemini 3.5 Pro 為什麼值得關注

從曝光資訊看，Gemini 3.5 Pro 可能是一次跳級命名。

此前外界還在討論 Gemini 3.2，隨後又出現 Gemini 3.5 Pro 的說法。如果命名屬實，說明 Google 想在新一輪發布裡講一個更大的版本故事，而不是只做常規小更新。

目前流出的重點主要集中在三方面：

編程和推理能力繼續提升；
SVG、互動式頁面、動畫和 3D 生成能力增強；
新的 Agent 產品 Gemini Spark 可能進入前台。

這些方向並不意外。Gemini 系列一直強調多模態，Google 也有足夠強的分發渠道。真正的問題是，它能不能在開發者工具和 Agent 工作流上趕上 OpenAI、Anthropic 的節奏。

編程能力是 Google 最需要補的課

大模型競爭進入 2026 年後，編程已經不只是「模型能力測試項」，而是最直接的產品入口。

原因很簡單：AI 編程工具有高頻使用場景，也能產生大量可回饋的資料。開發者每天讓模型讀程式碼、改程式碼、跑測試、修 bug，這些互動天然會推動下一代模型和工具鏈繼續進化。

過去一年，Claude Code 在開發者群體裡聲量很高，OpenAI 也持續強化 Codex 與 ChatGPT 的協同。相比之下，Google 雖然有 Antigravity 等產品，但外部存在感並不算強。

這也是 Gemini 3.5 Pro 被重點觀察的原因。如果它只是聊天更強、回答更快，意義有限；如果它能真正改善程式碼理解、跨檔案修改、工具呼叫和長任務執行，才可能改變開發者工作流。

Gemini Spark 可能是更大的變數

比模型本身更激進的，是傳聞中的 Gemini Spark。

按照曝光描述，Spark 的定位不是普通聊天助手，而是全天候運行的 AI Agent。它可能接入郵件、日程、網頁、任務、帳號狀態和個人上下文，幫助使用者處理多步驟工作流。

這類產品的想像空間很大。比如：

自動整理收件箱；
幫使用者跟進任務；
在網頁上執行操作；
處理跨應用流程；
根據個人偏好安排日常事務。

但風險也同樣明顯。一個全天候 Agent 如果能存取登入狀態、瀏覽器資料、檔案、位置和第三方服務，就必須回答幾個問題：什麼時候需要使用者確認？哪些操作必須禁止自動執行？資料會不會被分享給第三方？遠端瀏覽器和憑證如何隔離？

所以 Spark 真正的看點，不只是「能不能幫你幹活」，而是 Google 能否把權限、稽核、確認機制和使用者控制做得足夠清楚。

MCP 工具接入說明什麼

爆料裡還提到，新的 Gemini 選擇器可能出現 MCP 相關模型或測試入口。

如果這部分最終落地，說明 Google 也在把模型從「問答系統」推向「工具操作系統」。模型不再只是生成文字，而是要能呼叫外部工具、存取業務系統、讀寫檔案、執行命令，並在多個步驟之間保持任務狀態。

這和 OpenAI、Anthropic 的方向是一致的。誰能讓模型更穩定地呼叫工具，誰就更容易把 AI 嵌進真實工作流。

不過，MCP 接入本身不是終點。真正難的是穩定性：

模型能否正確選擇工具；
參數是否可靠；
失敗後能不能恢復；
權限邊界是否明確；
使用者能不能追蹤每一步操作。

如果這些問題沒解決，工具越多，出錯面也越大。

多模態仍然是 Google 的優勢牌

Google 最有機會打出差異化的地方，仍然是多模態。

從曝光的 SVG、互動式頁面、動畫和視覺生成案例看，Gemini 可能繼續強化「從提示詞生成可互動內容」的能力。相比單純寫一段程式碼，這更接近產品原型生成：使用者描述一個想法，模型直接給出可操作、可調節、可預覽的介面。

這條路線很適合 Google。它既能承接 Gemini 的多模態能力，也能和 Android、Chrome、Workspace、搜尋、廣告、雲服務等入口結合。

如果 Google 想避免只在「誰的程式碼模型更強」上硬拼，它很可能會把重點放到更完整的多模態 Agent 系統上。

三家公司的打法正在分化

現在的大模型競爭已經不是單一模型排行榜競爭。

OpenAI 的優勢在產品迭代和分發節奏，Codex、ChatGPT、企業工具和 API 之間的聯動越來越緊。

Anthropic 的優勢在開發者心智和程式碼模型品質，Claude Code 已經成了很多人預設的 AI 編程入口。

Google 的優勢則是生態入口。Gmail、Docs、Chrome、Android、搜尋、YouTube、地圖和雲服務構成了一個巨大的個人與企業資料網路。只要 Agent 能安全接入這些入口，Google 就有機會從「模型追趕者」變成「工作流入口控制者」。

這也是 Gemini Spark 值得關注的原因。它不一定需要在所有基準測試上第一，但只要能進入日常工作流，就可能形成自己的護城河。

普通使用者該怎麼看

對普通使用者來說，短期不必被每一次爆料牽著走。

更實用的觀察點有三個：

Gemini 3.5 Pro 的編程能力是否真的改善，尤其是複雜倉庫、長上下文和工具呼叫。
Gemini Spark 是否預設安全，敏感操作前是否有明確確認和可追蹤記錄。
Google 是否給出清晰價格、額度和企業權限管理，而不是只展示演示效果。

如果只是生成幾張漂亮截圖，價值有限。能不能穩定接入真實工作流，才是這一輪 AI Agent 產品的分水嶺。

對開發者意味著什麼

開發者最應該關注的不是「哪個模型贏了」，而是自己的工作流是否可遷移。

現在 Claude Code、Codex、Gemini、Antigravity、Cursor、Windsurf 等工具都在搶入口。如果把所有流程都綁死在某一個平台上，未來成本、額度、模型策略或權限規則一變，遷移會很痛。

更穩妥的做法是：

重要專案保留標準 Git 工作流；
自動修改後必須看 diff；
關鍵任務用測試和 CI 兜底；
不把生產憑證交給不透明 Agent；
能用開放協議接工具時，優先選擇可替換方案。

模型會繼續變強，但工程紀律不會過時。

小結

Gemini 3.5 Pro 的爆料說明，Google 正在加速補齊 AI 編程和 Agent 入口。模型能力提升是一部分，Gemini Spark 這類全天候 Agent 可能才是更大的戰略動作。

但越是能幫使用者「自動幹活」的系統，越需要嚴格的權限邊界和可驗證流程。對 Google 來說，真正的挑戰不只是追上 GPT-5.5 或 Claude，而是把強模型、安全機制和生態入口組合成一個可信的日常工作流。

如果這一步做成，Gemini 不一定要在每個榜單上第一，也可能重新拿回一部分 AI 入口主動權。

Google AI on KnightLi的博客