Gemini 3.5 Pro 還沒正式發布,相關爆料已經開始升溫。
這輪資訊裡有幾個關鍵詞:Gemini 3.5 Pro、代號 Cappuccino、Gemini Spark、AI 編程、MCP 工具接入。它們指向同一個方向:Google 不只是想更新一個聊天模型,而是想把模型、工具、Agent 和 Google 生態入口重新綁在一起。
不過,在正式發布前,這些資訊都應該按「爆料」看待。真正值得關注的不是某一張截圖或某一個跑分,而是 Google 接下來可能要補的幾塊短板。
Gemini 3.5 Pro 為什麼值得關注
從曝光資訊看,Gemini 3.5 Pro 可能是一次跳級命名。
此前外界還在討論 Gemini 3.2,隨後又出現 Gemini 3.5 Pro 的說法。如果命名屬實,說明 Google 想在新一輪發布裡講一個更大的版本故事,而不是只做常規小更新。
目前流出的重點主要集中在三方面:
- 編程和推理能力繼續提升;
- SVG、互動式頁面、動畫和 3D 生成能力增強;
- 新的 Agent 產品 Gemini Spark 可能進入前台。
這些方向並不意外。Gemini 系列一直強調多模態,Google 也有足夠強的分發渠道。真正的問題是,它能不能在開發者工具和 Agent 工作流上趕上 OpenAI、Anthropic 的節奏。
編程能力是 Google 最需要補的課
大模型競爭進入 2026 年後,編程已經不只是「模型能力測試項」,而是最直接的產品入口。
原因很簡單:AI 編程工具有高頻使用場景,也能產生大量可回饋的資料。開發者每天讓模型讀程式碼、改程式碼、跑測試、修 bug,這些互動天然會推動下一代模型和工具鏈繼續進化。
過去一年,Claude Code 在開發者群體裡聲量很高,OpenAI 也持續強化 Codex 與 ChatGPT 的協同。相比之下,Google 雖然有 Antigravity 等產品,但外部存在感並不算強。
這也是 Gemini 3.5 Pro 被重點觀察的原因。如果它只是聊天更強、回答更快,意義有限;如果它能真正改善程式碼理解、跨檔案修改、工具呼叫和長任務執行,才可能改變開發者工作流。
Gemini Spark 可能是更大的變數
比模型本身更激進的,是傳聞中的 Gemini Spark。
按照曝光描述,Spark 的定位不是普通聊天助手,而是全天候運行的 AI Agent。它可能接入郵件、日程、網頁、任務、帳號狀態和個人上下文,幫助使用者處理多步驟工作流。
這類產品的想像空間很大。比如:
- 自動整理收件箱;
- 幫使用者跟進任務;
- 在網頁上執行操作;
- 處理跨應用流程;
- 根據個人偏好安排日常事務。
但風險也同樣明顯。一個全天候 Agent 如果能存取登入狀態、瀏覽器資料、檔案、位置和第三方服務,就必須回答幾個問題:什麼時候需要使用者確認?哪些操作必須禁止自動執行?資料會不會被分享給第三方?遠端瀏覽器和憑證如何隔離?
所以 Spark 真正的看點,不只是「能不能幫你幹活」,而是 Google 能否把權限、稽核、確認機制和使用者控制做得足夠清楚。
MCP 工具接入說明什麼
爆料裡還提到,新的 Gemini 選擇器可能出現 MCP 相關模型或測試入口。
如果這部分最終落地,說明 Google 也在把模型從「問答系統」推向「工具操作系統」。模型不再只是生成文字,而是要能呼叫外部工具、存取業務系統、讀寫檔案、執行命令,並在多個步驟之間保持任務狀態。
這和 OpenAI、Anthropic 的方向是一致的。誰能讓模型更穩定地呼叫工具,誰就更容易把 AI 嵌進真實工作流。
不過,MCP 接入本身不是終點。真正難的是穩定性:
- 模型能否正確選擇工具;
- 參數是否可靠;
- 失敗後能不能恢復;
- 權限邊界是否明確;
- 使用者能不能追蹤每一步操作。
如果這些問題沒解決,工具越多,出錯面也越大。
多模態仍然是 Google 的優勢牌
Google 最有機會打出差異化的地方,仍然是多模態。
從曝光的 SVG、互動式頁面、動畫和視覺生成案例看,Gemini 可能繼續強化「從提示詞生成可互動內容」的能力。相比單純寫一段程式碼,這更接近產品原型生成:使用者描述一個想法,模型直接給出可操作、可調節、可預覽的介面。
這條路線很適合 Google。它既能承接 Gemini 的多模態能力,也能和 Android、Chrome、Workspace、搜尋、廣告、雲服務等入口結合。
如果 Google 想避免只在「誰的程式碼模型更強」上硬拼,它很可能會把重點放到更完整的多模態 Agent 系統上。
三家公司的打法正在分化
現在的大模型競爭已經不是單一模型排行榜競爭。
OpenAI 的優勢在產品迭代和分發節奏,Codex、ChatGPT、企業工具和 API 之間的聯動越來越緊。
Anthropic 的優勢在開發者心智和程式碼模型品質,Claude Code 已經成了很多人預設的 AI 編程入口。
Google 的優勢則是生態入口。Gmail、Docs、Chrome、Android、搜尋、YouTube、地圖和雲服務構成了一個巨大的個人與企業資料網路。只要 Agent 能安全接入這些入口,Google 就有機會從「模型追趕者」變成「工作流入口控制者」。
這也是 Gemini Spark 值得關注的原因。它不一定需要在所有基準測試上第一,但只要能進入日常工作流,就可能形成自己的護城河。
普通使用者該怎麼看
對普通使用者來說,短期不必被每一次爆料牽著走。
更實用的觀察點有三個:
- Gemini 3.5 Pro 的編程能力是否真的改善,尤其是複雜倉庫、長上下文和工具呼叫。
- Gemini Spark 是否預設安全,敏感操作前是否有明確確認和可追蹤記錄。
- Google 是否給出清晰價格、額度和企業權限管理,而不是只展示演示效果。
如果只是生成幾張漂亮截圖,價值有限。能不能穩定接入真實工作流,才是這一輪 AI Agent 產品的分水嶺。
對開發者意味著什麼
開發者最應該關注的不是「哪個模型贏了」,而是自己的工作流是否可遷移。
現在 Claude Code、Codex、Gemini、Antigravity、Cursor、Windsurf 等工具都在搶入口。如果把所有流程都綁死在某一個平台上,未來成本、額度、模型策略或權限規則一變,遷移會很痛。
更穩妥的做法是:
- 重要專案保留標準 Git 工作流;
- 自動修改後必須看 diff;
- 關鍵任務用測試和 CI 兜底;
- 不把生產憑證交給不透明 Agent;
- 能用開放協議接工具時,優先選擇可替換方案。
模型會繼續變強,但工程紀律不會過時。
小結
Gemini 3.5 Pro 的爆料說明,Google 正在加速補齊 AI 編程和 Agent 入口。模型能力提升是一部分,Gemini Spark 這類全天候 Agent 可能才是更大的戰略動作。
但越是能幫使用者「自動幹活」的系統,越需要嚴格的權限邊界和可驗證流程。對 Google 來說,真正的挑戰不只是追上 GPT-5.5 或 Claude,而是把強模型、安全機制和生態入口組合成一個可信的日常工作流。
如果這一步做成,Gemini 不一定要在每個榜單上第一,也可能重新拿回一部分 AI 入口主動權。