<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>Gemini Spark on KnightLi的博客</title>
        <link>https://www.knightli.com/tags/gemini-spark/</link>
        <description>Recent content in Gemini Spark on KnightLi的博客</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-cn</language>
        <lastBuildDate>Sun, 17 May 2026 11:58:08 +0800</lastBuildDate><atom:link href="https://www.knightli.com/tags/gemini-spark/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>Google Gemini Spark 爆料解读：一个 24 小时在线的 Gemini Agent 可能要来了</title>
        <link>https://www.knightli.com/2026/05/17/google-gemini-spark-ai-agent-leak/</link>
        <pubDate>Sun, 17 May 2026 11:58:08 +0800</pubDate>
        
        <guid>https://www.knightli.com/2026/05/17/google-gemini-spark-ai-agent-leak/</guid>
        <description>&lt;p&gt;Google 还没有正式发布 &lt;code&gt;Gemini Spark&lt;/code&gt;。&lt;/p&gt;
&lt;p&gt;目前关于它的信息，主要来自 Gemini Web 内部测试界面、社区截图、TestingCatalog 报道，以及 36Kr / 新智元对相关爆料的整理。比较一致的说法是：&lt;code&gt;Gemini Spark BETA&lt;/code&gt; 可能是 Google 正在准备的全天候 AI Agent，定位不再只是聊天助手，而是能在后台处理邮件、在线任务和多步骤工作流的“日常 AI 代理”。&lt;/p&gt;
&lt;p&gt;所以这篇文章先把边界说清楚：这是爆料解读，不是 Google 官方发布稿。所有功能、命名和上线时间，都要等 Google 正式公告确认。&lt;/p&gt;
&lt;h2 id=&#34;先说结论&#34;&gt;先说结论
&lt;/h2&gt;&lt;p&gt;从目前曝光的信息看，Gemini Spark 有三个重点：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;它可能是 Gemini 体系里的 24 小时在线 Agent，而不是普通聊天模型。&lt;/li&gt;
&lt;li&gt;它会调用更广泛的个人上下文，包括 Google 应用、聊天记录、任务、登录网站和位置信息等。&lt;/li&gt;
&lt;li&gt;它的风险和吸引力一样大，因为它可能涉及信息分享、远程浏览器数据、购买动作和第三方服务调用。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;如果 Google 真把 Spark 推出来，Gemini 的定位会发生变化：从“回答问题的 AI”变成“替你持续处理事务的 AI”。&lt;/p&gt;
&lt;h2 id=&#34;gemini-spark-是什么&#34;&gt;Gemini Spark 是什么
&lt;/h2&gt;&lt;p&gt;TestingCatalog 在 2026 年 5 月 14 日报道，Google 正在 Gemini Web 中测试 &lt;code&gt;Gemini Spark BETA&lt;/code&gt;。曝光的欢迎文案把它描述成一个 everyday AI agent，可以 24/7 帮用户处理 inbox、online tasks 和更多多步骤工作。&lt;/p&gt;
&lt;p&gt;36Kr / 新智元的文章也提到，Spark 被扒出后，外界看到的是一个“全时 Agent”方向：它可以全天候待命，处理收件箱、执行在线任务，甚至可能涉及购买和信息分享。&lt;/p&gt;
&lt;p&gt;这意味着 Spark 不是一个单纯的新模型名。它更像是 Gemini 产品层的一次升级：让 Gemini 从对话窗口里走出来，进入用户的邮件、网页、日程、任务和跨应用工作流。&lt;/p&gt;
&lt;h2 id=&#34;它可能怎么工作&#34;&gt;它可能怎么工作
&lt;/h2&gt;&lt;p&gt;根据 TestingCatalog 披露的隐藏 onboarding 文案，Gemini Spark 会从多种来源获取上下文，包括：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Connected Apps。&lt;/li&gt;
&lt;li&gt;skills。&lt;/li&gt;
&lt;li&gt;chats。&lt;/li&gt;
&lt;li&gt;tasks。&lt;/li&gt;
&lt;li&gt;用户登录过的网站。&lt;/li&gt;
&lt;li&gt;Personal intelligence。&lt;/li&gt;
&lt;li&gt;location。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这些信息会帮助 Spark 理解用户想完成什么，并在执行任务时调用必要的上下文。文案还提到，为了完成某些动作，Gemini 可能会把必要信息分享给第三方，例如姓名、联系方式、文件、偏好，以及用户可能认为敏感的信息。&lt;/p&gt;
&lt;p&gt;如果这些描述最终属实，Spark 的工作方式会更接近“带上下文的代理系统”，而不是一次性问答。它不是只看当前一句 prompt，而是可能综合长期偏好、连接应用、浏览器状态和任务历史。&lt;/p&gt;
&lt;h2 id=&#34;为什么它重要&#34;&gt;为什么它重要
&lt;/h2&gt;&lt;p&gt;Gemini Spark 的关键，不在于多一个聊天入口，而在于 Google 有天然的生态入口。&lt;/p&gt;
&lt;p&gt;OpenAI 和 Anthropic 可以做很强的 Agent，但它们很难天然拥有 Gmail、Calendar、Drive、Chrome、Android、Workspace 这条完整链路。Google 如果把 Spark 接进这些产品，用户不需要额外搭建太多工作流，就能让 Agent 进入日常事务。&lt;/p&gt;
&lt;p&gt;这会带来三个变化。&lt;/p&gt;
&lt;p&gt;第一，Gemini 会从被动问答变成主动执行。用户不再只是问“帮我总结这封邮件”，而是可能让它持续整理 inbox、追踪任务和执行后续动作。&lt;/p&gt;
&lt;p&gt;第二，Agent 会更依赖个人上下文。它越懂你的邮件、日程、文件、浏览器状态和偏好，越可能给出有用结果。&lt;/p&gt;
&lt;p&gt;第三，权限边界会变得更敏感。能做更多事，也意味着需要更清楚地知道它什么时候能做、能做到哪一步、是否需要确认。&lt;/p&gt;
&lt;h2 id=&#34;风险点在哪里&#34;&gt;风险点在哪里
&lt;/h2&gt;&lt;p&gt;TestingCatalog 披露的文案里，有几处很值得关注。&lt;/p&gt;
&lt;p&gt;第一，Spark 是 experimental。也就是说，即便它上线，也不应被当成完全成熟、无需监督的系统。&lt;/p&gt;
&lt;p&gt;第二，虽然系统设计上会在敏感操作前征求许可，但文案也提示，它可能会在未经询问的情况下分享信息或完成购买。&lt;/p&gt;
&lt;p&gt;第三，为了保持会话连续性，Gemini 会保存 remote browser data，比如登录细节和 remote code execution data。用户可以在 Settings 中清除这些数据，也可以关闭 Connected Apps 和 Personal intelligence 相关能力。&lt;/p&gt;
&lt;p&gt;这几个点合在一起，说明 Spark 的产品方向很激进：它要做真正能执行任务的 Agent，而不是只生成建议。但越接近真实执行，越需要严格的权限、审计、确认和回滚机制。&lt;/p&gt;
&lt;h2 id=&#34;和-remyai-ultra-的关系&#34;&gt;和 Remy、AI Ultra 的关系
&lt;/h2&gt;&lt;p&gt;TestingCatalog 提到，Spark 可能是此前内部代号 &lt;code&gt;Remy&lt;/code&gt; 的 agentic Gemini upgrade 的重命名版本，也与面向 Google AI Ultra 订阅用户的 Gemini Agent 方向有关。&lt;/p&gt;
&lt;p&gt;如果这个线索成立，Spark 可能不是凭空出现的新项目，而是 Google 把此前较高阶、较封闭的 Agent 能力重新包装，并准备推向更大范围用户。&lt;/p&gt;
&lt;p&gt;36Kr / 新智元也把它描述成从 “Remy” 到 “Spark” 的升级：Gemini Agent 不再只是一个功能，而是要走向 24/7 的数字生活管家。&lt;/p&gt;
&lt;p&gt;不过这仍然是基于爆料信息的判断。Google 是否会使用 &lt;code&gt;Spark&lt;/code&gt; 这个正式名称、是否只面向 AI Ultra、是否推出更轻量订阅层，还要等官方确认。&lt;/p&gt;
&lt;h2 id=&#34;mcpskills-和工具生态&#34;&gt;MCP、skills 和工具生态
&lt;/h2&gt;&lt;p&gt;同一批社区截图里，还出现了 &lt;code&gt;MCP Tool Testing&lt;/code&gt; 这类模型选择器入口。36Kr 文章认为，这可能暗示新 Gemini 会原生支持 MCP 第三方工具接入，Thinking 模式也会重构。&lt;/p&gt;
&lt;p&gt;这条线索和 Spark 放在一起看，很有意思。&lt;/p&gt;
&lt;p&gt;如果 Spark 只是“会聊天的助手”，skills 和 MCP 的意义有限。但如果 Spark 是一个长期运行的 Agent，它就需要可靠地调用工具、访问网页、执行任务、读写上下文，并把结果交付给用户。&lt;/p&gt;
&lt;p&gt;也就是说，Spark 可能不是单点功能，而是 Google Agent 工具生态的一部分：模型负责理解和规划，skills / MCP / connected apps 负责执行和扩展。&lt;/p&gt;
&lt;h2 id=&#34;对普通用户意味着什么&#34;&gt;对普通用户意味着什么
&lt;/h2&gt;&lt;p&gt;如果 Gemini Spark 真的发布，普通用户最直接的变化可能是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;邮件不只是被总结，而是可以被分类、跟进和转成任务。&lt;/li&gt;
&lt;li&gt;网页任务不只是给建议，而是可能在远程浏览器中持续执行。&lt;/li&gt;
&lt;li&gt;日程、位置、偏好和历史对话会变成 Agent 的长期上下文。&lt;/li&gt;
&lt;li&gt;购买、预订、表单填写等动作可能进入 AI 执行范围。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这听起来很方便，但用户需要建立新的习惯：不再只看 AI 说了什么，还要看 AI 准备做什么、已经做了什么、能不能撤回、有没有记录。&lt;/p&gt;
&lt;p&gt;未来 AI Agent 的体验好不好，可能不只取决于模型聪不聪明，还取决于权限提示是否清楚、任务日志是否可查、错误操作能不能恢复。&lt;/p&gt;
&lt;h2 id=&#34;对开发者和团队意味着什么&#34;&gt;对开发者和团队意味着什么
&lt;/h2&gt;&lt;p&gt;对开发者来说，Spark 的意义在于 Google 可能正在把 Agent 从“演示产品”推向真实工作流平台。&lt;/p&gt;
&lt;p&gt;如果 Spark 能稳定连接 Google 应用、第三方工具和浏览器状态，那么开发者会关心：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;API 或扩展机制是否开放。&lt;/li&gt;
&lt;li&gt;MCP 或 skills 是否可由第三方接入。&lt;/li&gt;
&lt;li&gt;企业管理员能否控制权限、数据留存和审计。&lt;/li&gt;
&lt;li&gt;Agent 执行失败时是否有可追踪日志。&lt;/li&gt;
&lt;li&gt;是否支持沙盒、审批流和敏感操作确认。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;对团队来说，Spark 可能会先从 Gmail、Calendar、Docs、Drive、Chrome 这类高频场景切入。它未必一开始就适合完全自动化高风险业务，但很适合作为 inbox triage、会议跟进、资料整理、市场研究和轻量运营任务的助手。&lt;/p&gt;
&lt;h2 id=&#34;现在应该怎么看&#34;&gt;现在应该怎么看
&lt;/h2&gt;&lt;p&gt;这条消息适合用“高可信方向，低确定细节”来理解。&lt;/p&gt;
&lt;p&gt;高可信方向是：Google 确实在推进更主动、更长期运行、更深度接入生态的 Gemini Agent。TestingCatalog 报道的 Gemini Web 测试文案、社区截图和 36Kr 整理的多方爆料，都指向同一个方向。&lt;/p&gt;
&lt;p&gt;低确定细节是：正式名称、上线时间、权限规则、订阅层级、可用地区、是否开放 API、是否真的叫 Gemini Spark，都还不能下结论。&lt;/p&gt;
&lt;p&gt;所以现在最稳妥的判断是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;不要把 Spark 当成已经发布的正式产品。&lt;/li&gt;
&lt;li&gt;可以把它视为 Google 下一阶段 AI Agent 路线的强信号。&lt;/li&gt;
&lt;li&gt;真正值得等的是官方如何解释权限、隐私、第三方数据分享和远程浏览器数据保存。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;总结&#34;&gt;总结
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;Gemini Spark&lt;/code&gt; 如果最终发布，可能会是 Gemini 从聊天助手走向全天候 Agent 的关键一步。它不只是换一个模型，而是把 Gemini 放进 Google 生态的邮件、网页、任务、位置、个人智能和第三方服务里。&lt;/p&gt;
&lt;p&gt;它的潜力很大：更主动、更贴近真实工作流，也更容易借助 Google 的生态分发给大量用户。它的风险也同样大：一旦 AI 能分享信息、保存浏览器状态、执行购买和调用第三方服务，权限边界就必须非常清楚。&lt;/p&gt;
&lt;p&gt;所以 Gemini Spark 最值得关注的不是“它有多聪明”，而是 Google 准备怎样让一个 24 小时在线的 AI Agent 变得可控、可审计、可信任。&lt;/p&gt;
&lt;p&gt;参考链接：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://www.testingcatalog.com/google-prepares-gemini-spark-ai-agent-ahead-of-i-o-launch/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;TestingCatalog：Google prepares Gemini Spark AI Agent ahead of I/O launch&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://36kr.com/p/3810432812162816&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;36Kr：Gemini 3.5 Pro 全网首曝，编程追平 GPT-5.5，谷歌终于狠起来了&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        
    </channel>
</rss>
