Google Gemini Spark 爆料解讀:一個 24 小時在線的 Gemini Agent 可能要來了

整理 Google Gemini Spark BETA 的最新爆料:它可能是 Gemini Web 中測試的全天候 AI Agent,面向郵件處理、線上任務、多步驟工作流和 Google 生態上下文調用,但目前尚未正式發布,仍需等待 Google 官方確認。

Google 還沒有正式發布 Gemini Spark

目前關於它的資訊,主要來自 Gemini Web 內部測試介面、社群截圖、TestingCatalog 報導,以及 36Kr / 新智元對相關爆料的整理。比較一致的說法是:Gemini Spark BETA 可能是 Google 正在準備的全天候 AI Agent,定位不再只是聊天助手,而是能在後台處理郵件、線上任務和多步驟工作流的「日常 AI 代理」。

所以這篇文章先把邊界說清楚:這是爆料解讀,不是 Google 官方發布稿。所有功能、命名和上線時間,都要等 Google 正式公告確認。

先說結論

從目前曝光的資訊看,Gemini Spark 有三個重點:

  1. 它可能是 Gemini 體系裡的 24 小時在線 Agent,而不是普通聊天模型。
  2. 它會調用更廣泛的個人上下文,包括 Google 應用、聊天記錄、任務、登入網站和位置資訊等。
  3. 它的風險和吸引力一樣大,因為它可能涉及資訊分享、遠端瀏覽器資料、購買動作和第三方服務調用。

如果 Google 真把 Spark 推出來,Gemini 的定位會發生變化:從「回答問題的 AI」變成「替你持續處理事務的 AI」。

Gemini Spark 是什麼

TestingCatalog 在 2026 年 5 月 14 日報導,Google 正在 Gemini Web 中測試 Gemini Spark BETA。曝光的歡迎文案把它描述成一個 everyday AI agent,可以 24/7 幫使用者處理 inbox、online tasks 和更多多步驟工作。

36Kr / 新智元的文章也提到,Spark 被扒出後,外界看到的是一個「全時 Agent」方向:它可以全天候待命,處理收件匣、執行線上任務,甚至可能涉及購買和資訊分享。

這意味著 Spark 不是一個單純的新模型名。它更像是 Gemini 產品層的一次升級:讓 Gemini 從對話窗口裡走出來,進入使用者的郵件、網頁、日程、任務和跨應用工作流。

它可能怎麼工作

根據 TestingCatalog 披露的隱藏 onboarding 文案,Gemini Spark 會從多種來源取得上下文,包括:

  • Connected Apps。
  • skills。
  • chats。
  • tasks。
  • 使用者登入過的網站。
  • Personal intelligence。
  • location。

這些資訊會幫助 Spark 理解使用者想完成什麼,並在執行任務時調用必要的上下文。文案還提到,為了完成某些動作,Gemini 可能會把必要資訊分享給第三方,例如姓名、聯絡方式、文件、偏好,以及使用者可能認為敏感的資訊。

如果這些描述最終屬實,Spark 的工作方式會更接近「帶上下文的代理系統」,而不是一次性問答。它不是只看當前一句 prompt,而是可能綜合長期偏好、連接應用、瀏覽器狀態和任務歷史。

為什麼它重要

Gemini Spark 的關鍵,不在於多一個聊天入口,而在於 Google 有天然的生態入口。

OpenAI 和 Anthropic 可以做很強的 Agent,但它們很難天然擁有 Gmail、Calendar、Drive、Chrome、Android、Workspace 這條完整鏈路。Google 如果把 Spark 接進這些產品,使用者不需要額外搭建太多工作流,就能讓 Agent 進入日常事務。

這會帶來三個變化。

第一,Gemini 會從被動問答變成主動執行。使用者不再只是問「幫我總結這封郵件」,而是可能讓它持續整理 inbox、追蹤任務和執行後續動作。

第二,Agent 會更依賴個人上下文。它越懂你的郵件、日程、文件、瀏覽器狀態和偏好,越可能給出有用結果。

第三,權限邊界會變得更敏感。能做更多事,也意味著需要更清楚地知道它什麼時候能做、能做到哪一步、是否需要確認。

風險點在哪裡

TestingCatalog 披露的文案裡,有幾處很值得關注。

第一,Spark 是 experimental。也就是說,即便它上線,也不應被當成完全成熟、無需監督的系統。

第二,雖然系統設計上會在敏感操作前徵求許可,但文案也提示,它可能會在未經詢問的情況下分享資訊或完成購買。

第三,為了保持會話連續性,Gemini 會保存 remote browser data,比如登入細節和 remote code execution data。使用者可以在 Settings 中清除這些資料,也可以關閉 Connected Apps 和 Personal intelligence 相關能力。

這幾個點合在一起,說明 Spark 的產品方向很激進:它要做真正能執行任務的 Agent,而不是只生成建議。但越接近真實執行,越需要嚴格的權限、稽核、確認和回滾機制。

和 Remy、AI Ultra 的關係

TestingCatalog 提到,Spark 可能是此前內部代號 Remy 的 agentic Gemini upgrade 的重命名版本,也與面向 Google AI Ultra 訂閱使用者的 Gemini Agent 方向有關。

如果這個線索成立,Spark 可能不是憑空出現的新專案,而是 Google 把此前較高階、較封閉的 Agent 能力重新包裝,並準備推向更大範圍使用者。

36Kr / 新智元也把它描述成從 “Remy” 到 “Spark” 的升級:Gemini Agent 不再只是一個功能,而是要走向 24/7 的數位生活管家。

不過這仍然是基於爆料資訊的判斷。Google 是否會使用 Spark 這個正式名稱、是否只面向 AI Ultra、是否推出更輕量訂閱層,還要等官方確認。

MCP、skills 和工具生態

同一批社群截圖裡,還出現了 MCP Tool Testing 這類模型選擇器入口。36Kr 文章認為,這可能暗示新 Gemini 會原生支援 MCP 第三方工具接入,Thinking 模式也會重構。

這條線索和 Spark 放在一起看,很有意思。

如果 Spark 只是「會聊天的助手」,skills 和 MCP 的意義有限。但如果 Spark 是一個長期運行的 Agent,它就需要可靠地調用工具、存取網頁、執行任務、讀寫上下文,並把結果交付給使用者。

也就是說,Spark 可能不是單點功能,而是 Google Agent 工具生態的一部分:模型負責理解和規劃,skills / MCP / connected apps 負責執行和擴展。

對普通使用者意味著什麼

如果 Gemini Spark 真的發布,普通使用者最直接的變化可能是:

  • 郵件不只是被總結,而是可以被分類、跟進和轉成任務。
  • 網頁任務不只是給建議,而是可能在遠端瀏覽器中持續執行。
  • 日程、位置、偏好和歷史對話會變成 Agent 的長期上下文。
  • 購買、預訂、表單填寫等動作可能進入 AI 執行範圍。

這聽起來很方便,但使用者需要建立新的習慣:不再只看 AI 說了什麼,還要看 AI 準備做什麼、已經做了什麼、能不能撤回、有沒有記錄。

未來 AI Agent 的體驗好不好,可能不只取決於模型聰不聰明,還取決於權限提示是否清楚、任務日誌是否可查、錯誤操作能不能恢復。

對開發者和團隊意味著什麼

對開發者來說,Spark 的意義在於 Google 可能正在把 Agent 從「展示產品」推向真實工作流平台。

如果 Spark 能穩定連接 Google 應用、第三方工具和瀏覽器狀態,那麼開發者會關心:

  • API 或擴展機制是否開放。
  • MCP 或 skills 是否可由第三方接入。
  • 企業管理員能否控制權限、資料留存和稽核。
  • Agent 執行失敗時是否有可追蹤日誌。
  • 是否支援沙盒、審批流和敏感操作確認。

對團隊來說,Spark 可能會先從 Gmail、Calendar、Docs、Drive、Chrome 這類高頻場景切入。它未必一開始就適合完全自動化高風險業務,但很適合作為 inbox triage、會議跟進、資料整理、市場研究和輕量營運任務的助手。

現在應該怎麼看

這條消息適合用「高可信方向,低確定細節」來理解。

高可信方向是:Google 確實在推進更主動、更長期運行、更深度接入生態的 Gemini Agent。TestingCatalog 報導的 Gemini Web 測試文案、社群截圖和 36Kr 整理的多方爆料,都指向同一個方向。

低確定細節是:正式名稱、上線時間、權限規則、訂閱層級、可用地區、是否開放 API、是否真的叫 Gemini Spark,都還不能下結論。

所以現在最穩妥的判斷是:

  • 不要把 Spark 當成已經發布的正式產品。
  • 可以把它視為 Google 下一階段 AI Agent 路線的強訊號。
  • 真正值得等的是官方如何解釋權限、隱私、第三方資料分享和遠端瀏覽器資料保存。

總結

Gemini Spark 如果最終發布,可能會是 Gemini 從聊天助手走向全天候 Agent 的關鍵一步。它不只是換一個模型,而是把 Gemini 放進 Google 生態的郵件、網頁、任務、位置、個人智能和第三方服務裡。

它的潛力很大:更主動、更貼近真實工作流,也更容易借助 Google 的生態分發給大量使用者。它的風險也同樣大:一旦 AI 能分享資訊、保存瀏覽器狀態、執行購買和調用第三方服務,權限邊界就必須非常清楚。

所以 Gemini Spark 最值得關注的不是「它有多聰明」,而是 Google 準備怎樣讓一個 24 小時在線的 AI Agent 變得可控、可稽核、可信任。

參考連結:

记录并分享
使用 Hugo 建立
主題 StackJimmy 設計