Google 還沒有正式發布 Gemini Spark。
目前關於它的資訊,主要來自 Gemini Web 內部測試介面、社群截圖、TestingCatalog 報導,以及 36Kr / 新智元對相關爆料的整理。比較一致的說法是:Gemini Spark BETA 可能是 Google 正在準備的全天候 AI Agent,定位不再只是聊天助手,而是能在後台處理郵件、線上任務和多步驟工作流的「日常 AI 代理」。
所以這篇文章先把邊界說清楚:這是爆料解讀,不是 Google 官方發布稿。所有功能、命名和上線時間,都要等 Google 正式公告確認。
先說結論
從目前曝光的資訊看,Gemini Spark 有三個重點:
- 它可能是 Gemini 體系裡的 24 小時在線 Agent,而不是普通聊天模型。
- 它會調用更廣泛的個人上下文,包括 Google 應用、聊天記錄、任務、登入網站和位置資訊等。
- 它的風險和吸引力一樣大,因為它可能涉及資訊分享、遠端瀏覽器資料、購買動作和第三方服務調用。
如果 Google 真把 Spark 推出來,Gemini 的定位會發生變化:從「回答問題的 AI」變成「替你持續處理事務的 AI」。
Gemini Spark 是什麼
TestingCatalog 在 2026 年 5 月 14 日報導,Google 正在 Gemini Web 中測試 Gemini Spark BETA。曝光的歡迎文案把它描述成一個 everyday AI agent,可以 24/7 幫使用者處理 inbox、online tasks 和更多多步驟工作。
36Kr / 新智元的文章也提到,Spark 被扒出後,外界看到的是一個「全時 Agent」方向:它可以全天候待命,處理收件匣、執行線上任務,甚至可能涉及購買和資訊分享。
這意味著 Spark 不是一個單純的新模型名。它更像是 Gemini 產品層的一次升級:讓 Gemini 從對話窗口裡走出來,進入使用者的郵件、網頁、日程、任務和跨應用工作流。
它可能怎麼工作
根據 TestingCatalog 披露的隱藏 onboarding 文案,Gemini Spark 會從多種來源取得上下文,包括:
- Connected Apps。
- skills。
- chats。
- tasks。
- 使用者登入過的網站。
- Personal intelligence。
- location。
這些資訊會幫助 Spark 理解使用者想完成什麼,並在執行任務時調用必要的上下文。文案還提到,為了完成某些動作,Gemini 可能會把必要資訊分享給第三方,例如姓名、聯絡方式、文件、偏好,以及使用者可能認為敏感的資訊。
如果這些描述最終屬實,Spark 的工作方式會更接近「帶上下文的代理系統」,而不是一次性問答。它不是只看當前一句 prompt,而是可能綜合長期偏好、連接應用、瀏覽器狀態和任務歷史。
為什麼它重要
Gemini Spark 的關鍵,不在於多一個聊天入口,而在於 Google 有天然的生態入口。
OpenAI 和 Anthropic 可以做很強的 Agent,但它們很難天然擁有 Gmail、Calendar、Drive、Chrome、Android、Workspace 這條完整鏈路。Google 如果把 Spark 接進這些產品,使用者不需要額外搭建太多工作流,就能讓 Agent 進入日常事務。
這會帶來三個變化。
第一,Gemini 會從被動問答變成主動執行。使用者不再只是問「幫我總結這封郵件」,而是可能讓它持續整理 inbox、追蹤任務和執行後續動作。
第二,Agent 會更依賴個人上下文。它越懂你的郵件、日程、文件、瀏覽器狀態和偏好,越可能給出有用結果。
第三,權限邊界會變得更敏感。能做更多事,也意味著需要更清楚地知道它什麼時候能做、能做到哪一步、是否需要確認。
風險點在哪裡
TestingCatalog 披露的文案裡,有幾處很值得關注。
第一,Spark 是 experimental。也就是說,即便它上線,也不應被當成完全成熟、無需監督的系統。
第二,雖然系統設計上會在敏感操作前徵求許可,但文案也提示,它可能會在未經詢問的情況下分享資訊或完成購買。
第三,為了保持會話連續性,Gemini 會保存 remote browser data,比如登入細節和 remote code execution data。使用者可以在 Settings 中清除這些資料,也可以關閉 Connected Apps 和 Personal intelligence 相關能力。
這幾個點合在一起,說明 Spark 的產品方向很激進:它要做真正能執行任務的 Agent,而不是只生成建議。但越接近真實執行,越需要嚴格的權限、稽核、確認和回滾機制。
和 Remy、AI Ultra 的關係
TestingCatalog 提到,Spark 可能是此前內部代號 Remy 的 agentic Gemini upgrade 的重命名版本,也與面向 Google AI Ultra 訂閱使用者的 Gemini Agent 方向有關。
如果這個線索成立,Spark 可能不是憑空出現的新專案,而是 Google 把此前較高階、較封閉的 Agent 能力重新包裝,並準備推向更大範圍使用者。
36Kr / 新智元也把它描述成從 “Remy” 到 “Spark” 的升級:Gemini Agent 不再只是一個功能,而是要走向 24/7 的數位生活管家。
不過這仍然是基於爆料資訊的判斷。Google 是否會使用 Spark 這個正式名稱、是否只面向 AI Ultra、是否推出更輕量訂閱層,還要等官方確認。
MCP、skills 和工具生態
同一批社群截圖裡,還出現了 MCP Tool Testing 這類模型選擇器入口。36Kr 文章認為,這可能暗示新 Gemini 會原生支援 MCP 第三方工具接入,Thinking 模式也會重構。
這條線索和 Spark 放在一起看,很有意思。
如果 Spark 只是「會聊天的助手」,skills 和 MCP 的意義有限。但如果 Spark 是一個長期運行的 Agent,它就需要可靠地調用工具、存取網頁、執行任務、讀寫上下文,並把結果交付給使用者。
也就是說,Spark 可能不是單點功能,而是 Google Agent 工具生態的一部分:模型負責理解和規劃,skills / MCP / connected apps 負責執行和擴展。
對普通使用者意味著什麼
如果 Gemini Spark 真的發布,普通使用者最直接的變化可能是:
- 郵件不只是被總結,而是可以被分類、跟進和轉成任務。
- 網頁任務不只是給建議,而是可能在遠端瀏覽器中持續執行。
- 日程、位置、偏好和歷史對話會變成 Agent 的長期上下文。
- 購買、預訂、表單填寫等動作可能進入 AI 執行範圍。
這聽起來很方便,但使用者需要建立新的習慣:不再只看 AI 說了什麼,還要看 AI 準備做什麼、已經做了什麼、能不能撤回、有沒有記錄。
未來 AI Agent 的體驗好不好,可能不只取決於模型聰不聰明,還取決於權限提示是否清楚、任務日誌是否可查、錯誤操作能不能恢復。
對開發者和團隊意味著什麼
對開發者來說,Spark 的意義在於 Google 可能正在把 Agent 從「展示產品」推向真實工作流平台。
如果 Spark 能穩定連接 Google 應用、第三方工具和瀏覽器狀態,那麼開發者會關心:
- API 或擴展機制是否開放。
- MCP 或 skills 是否可由第三方接入。
- 企業管理員能否控制權限、資料留存和稽核。
- Agent 執行失敗時是否有可追蹤日誌。
- 是否支援沙盒、審批流和敏感操作確認。
對團隊來說,Spark 可能會先從 Gmail、Calendar、Docs、Drive、Chrome 這類高頻場景切入。它未必一開始就適合完全自動化高風險業務,但很適合作為 inbox triage、會議跟進、資料整理、市場研究和輕量營運任務的助手。
現在應該怎麼看
這條消息適合用「高可信方向,低確定細節」來理解。
高可信方向是:Google 確實在推進更主動、更長期運行、更深度接入生態的 Gemini Agent。TestingCatalog 報導的 Gemini Web 測試文案、社群截圖和 36Kr 整理的多方爆料,都指向同一個方向。
低確定細節是:正式名稱、上線時間、權限規則、訂閱層級、可用地區、是否開放 API、是否真的叫 Gemini Spark,都還不能下結論。
所以現在最穩妥的判斷是:
- 不要把 Spark 當成已經發布的正式產品。
- 可以把它視為 Google 下一階段 AI Agent 路線的強訊號。
- 真正值得等的是官方如何解釋權限、隱私、第三方資料分享和遠端瀏覽器資料保存。
總結
Gemini Spark 如果最終發布,可能會是 Gemini 從聊天助手走向全天候 Agent 的關鍵一步。它不只是換一個模型,而是把 Gemini 放進 Google 生態的郵件、網頁、任務、位置、個人智能和第三方服務裡。
它的潛力很大:更主動、更貼近真實工作流,也更容易借助 Google 的生態分發給大量使用者。它的風險也同樣大:一旦 AI 能分享資訊、保存瀏覽器狀態、執行購買和調用第三方服務,權限邊界就必須非常清楚。
所以 Gemini Spark 最值得關注的不是「它有多聰明」,而是 Google 準備怎樣讓一個 24 小時在線的 AI Agent 變得可控、可稽核、可信任。
參考連結: