Gemini 3.5 Pro 提前曝光:Google 想用 Spark Agent 搶回 AI 編程入口

圍繞 Gemini 3.5 Pro、Gemini Spark 和 Google AI 編程產品的最新爆料,整理其中值得關注的信號:模型能力繼續追趕,Agent 入口更激進,編程工具競爭正在成為三家大模型公司的關鍵戰場。

Gemini 3.5 Pro 還沒正式發布,相關爆料已經開始升溫。

這輪資訊裡有幾個關鍵詞:Gemini 3.5 Pro、代號 Cappuccino、Gemini Spark、AI 編程、MCP 工具接入。它們指向同一個方向:Google 不只是想更新一個聊天模型,而是想把模型、工具、Agent 和 Google 生態入口重新綁在一起。

不過,在正式發布前,這些資訊都應該按「爆料」看待。真正值得關注的不是某一張截圖或某一個跑分,而是 Google 接下來可能要補的幾塊短板。

Gemini 3.5 Pro 為什麼值得關注

從曝光資訊看,Gemini 3.5 Pro 可能是一次跳級命名。

此前外界還在討論 Gemini 3.2,隨後又出現 Gemini 3.5 Pro 的說法。如果命名屬實,說明 Google 想在新一輪發布裡講一個更大的版本故事,而不是只做常規小更新。

目前流出的重點主要集中在三方面:

  • 編程和推理能力繼續提升;
  • SVG、互動式頁面、動畫和 3D 生成能力增強;
  • 新的 Agent 產品 Gemini Spark 可能進入前台。

這些方向並不意外。Gemini 系列一直強調多模態,Google 也有足夠強的分發渠道。真正的問題是,它能不能在開發者工具和 Agent 工作流上趕上 OpenAI、Anthropic 的節奏。

編程能力是 Google 最需要補的課

大模型競爭進入 2026 年後,編程已經不只是「模型能力測試項」,而是最直接的產品入口。

原因很簡單:AI 編程工具有高頻使用場景,也能產生大量可回饋的資料。開發者每天讓模型讀程式碼、改程式碼、跑測試、修 bug,這些互動天然會推動下一代模型和工具鏈繼續進化。

過去一年,Claude Code 在開發者群體裡聲量很高,OpenAI 也持續強化 Codex 與 ChatGPT 的協同。相比之下,Google 雖然有 Antigravity 等產品,但外部存在感並不算強。

這也是 Gemini 3.5 Pro 被重點觀察的原因。如果它只是聊天更強、回答更快,意義有限;如果它能真正改善程式碼理解、跨檔案修改、工具呼叫和長任務執行,才可能改變開發者工作流。

Gemini Spark 可能是更大的變數

比模型本身更激進的,是傳聞中的 Gemini Spark。

按照曝光描述,Spark 的定位不是普通聊天助手,而是全天候運行的 AI Agent。它可能接入郵件、日程、網頁、任務、帳號狀態和個人上下文,幫助使用者處理多步驟工作流。

這類產品的想像空間很大。比如:

  • 自動整理收件箱;
  • 幫使用者跟進任務;
  • 在網頁上執行操作;
  • 處理跨應用流程;
  • 根據個人偏好安排日常事務。

但風險也同樣明顯。一個全天候 Agent 如果能存取登入狀態、瀏覽器資料、檔案、位置和第三方服務,就必須回答幾個問題:什麼時候需要使用者確認?哪些操作必須禁止自動執行?資料會不會被分享給第三方?遠端瀏覽器和憑證如何隔離?

所以 Spark 真正的看點,不只是「能不能幫你幹活」,而是 Google 能否把權限、稽核、確認機制和使用者控制做得足夠清楚。

MCP 工具接入說明什麼

爆料裡還提到,新的 Gemini 選擇器可能出現 MCP 相關模型或測試入口。

如果這部分最終落地,說明 Google 也在把模型從「問答系統」推向「工具操作系統」。模型不再只是生成文字,而是要能呼叫外部工具、存取業務系統、讀寫檔案、執行命令,並在多個步驟之間保持任務狀態。

這和 OpenAI、Anthropic 的方向是一致的。誰能讓模型更穩定地呼叫工具,誰就更容易把 AI 嵌進真實工作流。

不過,MCP 接入本身不是終點。真正難的是穩定性:

  • 模型能否正確選擇工具;
  • 參數是否可靠;
  • 失敗後能不能恢復;
  • 權限邊界是否明確;
  • 使用者能不能追蹤每一步操作。

如果這些問題沒解決,工具越多,出錯面也越大。

多模態仍然是 Google 的優勢牌

Google 最有機會打出差異化的地方,仍然是多模態。

從曝光的 SVG、互動式頁面、動畫和視覺生成案例看,Gemini 可能繼續強化「從提示詞生成可互動內容」的能力。相比單純寫一段程式碼,這更接近產品原型生成:使用者描述一個想法,模型直接給出可操作、可調節、可預覽的介面。

這條路線很適合 Google。它既能承接 Gemini 的多模態能力,也能和 Android、Chrome、Workspace、搜尋、廣告、雲服務等入口結合。

如果 Google 想避免只在「誰的程式碼模型更強」上硬拼,它很可能會把重點放到更完整的多模態 Agent 系統上。

三家公司的打法正在分化

現在的大模型競爭已經不是單一模型排行榜競爭。

OpenAI 的優勢在產品迭代和分發節奏,Codex、ChatGPT、企業工具和 API 之間的聯動越來越緊。

Anthropic 的優勢在開發者心智和程式碼模型品質,Claude Code 已經成了很多人預設的 AI 編程入口。

Google 的優勢則是生態入口。Gmail、Docs、Chrome、Android、搜尋、YouTube、地圖和雲服務構成了一個巨大的個人與企業資料網路。只要 Agent 能安全接入這些入口,Google 就有機會從「模型追趕者」變成「工作流入口控制者」。

這也是 Gemini Spark 值得關注的原因。它不一定需要在所有基準測試上第一,但只要能進入日常工作流,就可能形成自己的護城河。

普通使用者該怎麼看

對普通使用者來說,短期不必被每一次爆料牽著走。

更實用的觀察點有三個:

  1. Gemini 3.5 Pro 的編程能力是否真的改善,尤其是複雜倉庫、長上下文和工具呼叫。
  2. Gemini Spark 是否預設安全,敏感操作前是否有明確確認和可追蹤記錄。
  3. Google 是否給出清晰價格、額度和企業權限管理,而不是只展示演示效果。

如果只是生成幾張漂亮截圖,價值有限。能不能穩定接入真實工作流,才是這一輪 AI Agent 產品的分水嶺。

對開發者意味著什麼

開發者最應該關注的不是「哪個模型贏了」,而是自己的工作流是否可遷移。

現在 Claude Code、Codex、Gemini、Antigravity、Cursor、Windsurf 等工具都在搶入口。如果把所有流程都綁死在某一個平台上,未來成本、額度、模型策略或權限規則一變,遷移會很痛。

更穩妥的做法是:

  • 重要專案保留標準 Git 工作流;
  • 自動修改後必須看 diff;
  • 關鍵任務用測試和 CI 兜底;
  • 不把生產憑證交給不透明 Agent;
  • 能用開放協議接工具時,優先選擇可替換方案。

模型會繼續變強,但工程紀律不會過時。

小結

Gemini 3.5 Pro 的爆料說明,Google 正在加速補齊 AI 編程和 Agent 入口。模型能力提升是一部分,Gemini Spark 這類全天候 Agent 可能才是更大的戰略動作。

但越是能幫使用者「自動幹活」的系統,越需要嚴格的權限邊界和可驗證流程。對 Google 來說,真正的挑戰不只是追上 GPT-5.5 或 Claude,而是把強模型、安全機制和生態入口組合成一個可信的日常工作流。

如果這一步做成,Gemini 不一定要在每個榜單上第一,也可能重新拿回一部分 AI 入口主動權。

记录并分享
使用 Hugo 建立
主題 StackJimmy 設計