Google Gemini Spark 爆料解读：一个 24 小时在线的 Gemini Agent 可能要来了

Sun, 17 May 2026 11:58:08 +0800

Google 还没有正式发布 Gemini Spark。

目前关于它的信息，主要来自 Gemini Web 内部测试界面、社区截图、TestingCatalog 报道，以及 36Kr / 新智元对相关爆料的整理。比较一致的说法是：Gemini Spark BETA 可能是 Google 正在准备的全天候 AI Agent，定位不再只是聊天助手，而是能在后台处理邮件、在线任务和多步骤工作流的“日常 AI 代理”。

所以这篇文章先把边界说清楚：这是爆料解读，不是 Google 官方发布稿。所有功能、命名和上线时间，都要等 Google 正式公告确认。

先说结论

从目前曝光的信息看，Gemini Spark 有三个重点：

它可能是 Gemini 体系里的 24 小时在线 Agent，而不是普通聊天模型。
它会调用更广泛的个人上下文，包括 Google 应用、聊天记录、任务、登录网站和位置信息等。
它的风险和吸引力一样大，因为它可能涉及信息分享、远程浏览器数据、购买动作和第三方服务调用。

如果 Google 真把 Spark 推出来，Gemini 的定位会发生变化：从“回答问题的 AI”变成“替你持续处理事务的 AI”。

Gemini Spark 是什么

TestingCatalog 在 2026 年 5 月 14 日报道，Google 正在 Gemini Web 中测试 Gemini Spark BETA。曝光的欢迎文案把它描述成一个 everyday AI agent，可以 24/7 帮用户处理 inbox、online tasks 和更多多步骤工作。

36Kr / 新智元的文章也提到，Spark 被扒出后，外界看到的是一个“全时 Agent”方向：它可以全天候待命，处理收件箱、执行在线任务，甚至可能涉及购买和信息分享。

这意味着 Spark 不是一个单纯的新模型名。它更像是 Gemini 产品层的一次升级：让 Gemini 从对话窗口里走出来，进入用户的邮件、网页、日程、任务和跨应用工作流。

它可能怎么工作

根据 TestingCatalog 披露的隐藏 onboarding 文案，Gemini Spark 会从多种来源获取上下文，包括：

Connected Apps。
skills。
chats。
tasks。
用户登录过的网站。
Personal intelligence。
location。

这些信息会帮助 Spark 理解用户想完成什么，并在执行任务时调用必要的上下文。文案还提到，为了完成某些动作，Gemini 可能会把必要信息分享给第三方，例如姓名、联系方式、文件、偏好，以及用户可能认为敏感的信息。

如果这些描述最终属实，Spark 的工作方式会更接近“带上下文的代理系统”，而不是一次性问答。它不是只看当前一句 prompt，而是可能综合长期偏好、连接应用、浏览器状态和任务历史。

为什么它重要

Gemini Spark 的关键，不在于多一个聊天入口，而在于 Google 有天然的生态入口。

OpenAI 和 Anthropic 可以做很强的 Agent，但它们很难天然拥有 Gmail、Calendar、Drive、Chrome、Android、Workspace 这条完整链路。Google 如果把 Spark 接进这些产品，用户不需要额外搭建太多工作流，就能让 Agent 进入日常事务。

这会带来三个变化。

第一，Gemini 会从被动问答变成主动执行。用户不再只是问“帮我总结这封邮件”，而是可能让它持续整理 inbox、追踪任务和执行后续动作。

第二，Agent 会更依赖个人上下文。它越懂你的邮件、日程、文件、浏览器状态和偏好，越可能给出有用结果。

第三，权限边界会变得更敏感。能做更多事，也意味着需要更清楚地知道它什么时候能做、能做到哪一步、是否需要确认。

风险点在哪里

TestingCatalog 披露的文案里，有几处很值得关注。

第一，Spark 是 experimental。也就是说，即便它上线，也不应被当成完全成熟、无需监督的系统。

第二，虽然系统设计上会在敏感操作前征求许可，但文案也提示，它可能会在未经询问的情况下分享信息或完成购买。

第三，为了保持会话连续性，Gemini 会保存 remote browser data，比如登录细节和 remote code execution data。用户可以在 Settings 中清除这些数据，也可以关闭 Connected Apps 和 Personal intelligence 相关能力。

这几个点合在一起，说明 Spark 的产品方向很激进：它要做真正能执行任务的 Agent，而不是只生成建议。但越接近真实执行，越需要严格的权限、审计、确认和回滚机制。

和 Remy、AI Ultra 的关系

TestingCatalog 提到，Spark 可能是此前内部代号 Remy 的 agentic Gemini upgrade 的重命名版本，也与面向 Google AI Ultra 订阅用户的 Gemini Agent 方向有关。

如果这个线索成立，Spark 可能不是凭空出现的新项目，而是 Google 把此前较高阶、较封闭的 Agent 能力重新包装，并准备推向更大范围用户。

36Kr / 新智元也把它描述成从 “Remy” 到 “Spark” 的升级：Gemini Agent 不再只是一个功能，而是要走向 24/7 的数字生活管家。

不过这仍然是基于爆料信息的判断。Google 是否会使用 Spark 这个正式名称、是否只面向 AI Ultra、是否推出更轻量订阅层，还要等官方确认。

MCP、skills 和工具生态

同一批社区截图里，还出现了 MCP Tool Testing 这类模型选择器入口。36Kr 文章认为，这可能暗示新 Gemini 会原生支持 MCP 第三方工具接入，Thinking 模式也会重构。

这条线索和 Spark 放在一起看，很有意思。

如果 Spark 只是“会聊天的助手”，skills 和 MCP 的意义有限。但如果 Spark 是一个长期运行的 Agent，它就需要可靠地调用工具、访问网页、执行任务、读写上下文，并把结果交付给用户。

也就是说，Spark 可能不是单点功能，而是 Google Agent 工具生态的一部分：模型负责理解和规划，skills / MCP / connected apps 负责执行和扩展。

对普通用户意味着什么

如果 Gemini Spark 真的发布，普通用户最直接的变化可能是：

邮件不只是被总结，而是可以被分类、跟进和转成任务。
网页任务不只是给建议，而是可能在远程浏览器中持续执行。
日程、位置、偏好和历史对话会变成 Agent 的长期上下文。
购买、预订、表单填写等动作可能进入 AI 执行范围。

这听起来很方便，但用户需要建立新的习惯：不再只看 AI 说了什么，还要看 AI 准备做什么、已经做了什么、能不能撤回、有没有记录。

未来 AI Agent 的体验好不好，可能不只取决于模型聪不聪明，还取决于权限提示是否清楚、任务日志是否可查、错误操作能不能恢复。

对开发者和团队意味着什么

对开发者来说，Spark 的意义在于 Google 可能正在把 Agent 从“演示产品”推向真实工作流平台。

如果 Spark 能稳定连接 Google 应用、第三方工具和浏览器状态，那么开发者会关心：

API 或扩展机制是否开放。
MCP 或 skills 是否可由第三方接入。
企业管理员能否控制权限、数据留存和审计。
Agent 执行失败时是否有可追踪日志。
是否支持沙盒、审批流和敏感操作确认。

对团队来说，Spark 可能会先从 Gmail、Calendar、Docs、Drive、Chrome 这类高频场景切入。它未必一开始就适合完全自动化高风险业务，但很适合作为 inbox triage、会议跟进、资料整理、市场研究和轻量运营任务的助手。

现在应该怎么看

这条消息适合用“高可信方向，低确定细节”来理解。

高可信方向是：Google 确实在推进更主动、更长期运行、更深度接入生态的 Gemini Agent。TestingCatalog 报道的 Gemini Web 测试文案、社区截图和 36Kr 整理的多方爆料，都指向同一个方向。

低确定细节是：正式名称、上线时间、权限规则、订阅层级、可用地区、是否开放 API、是否真的叫 Gemini Spark，都还不能下结论。

所以现在最稳妥的判断是：

不要把 Spark 当成已经发布的正式产品。
可以把它视为 Google 下一阶段 AI Agent 路线的强信号。
真正值得等的是官方如何解释权限、隐私、第三方数据分享和远程浏览器数据保存。

总结

Gemini Spark 如果最终发布，可能会是 Gemini 从聊天助手走向全天候 Agent 的关键一步。它不只是换一个模型，而是把 Gemini 放进 Google 生态的邮件、网页、任务、位置、个人智能和第三方服务里。

它的潜力很大：更主动、更贴近真实工作流，也更容易借助 Google 的生态分发给大量用户。它的风险也同样大：一旦 AI 能分享信息、保存浏览器状态、执行购买和调用第三方服务，权限边界就必须非常清楚。

所以 Gemini Spark 最值得关注的不是“它有多聪明”，而是 Google 准备怎样让一个 24 小时在线的 AI Agent 变得可控、可审计、可信任。

参考链接：

Gemini Spark on KnightLi的博客