Google 还没有正式发布 Gemini 3.5 Pro。
目前能看到的信息,主要来自开发者社区截图、匿名跑分、爆料人消息和媒体转述。36Kr / 新智元在 2026 年 5 月 15 日整理称,新一代 Gemini 检查点内部代号可能是 Cappuccino,相关模型已经在社区和评测平台中提前曝光。
这类信息还不能等同于官方发布,但它透露出一个清晰方向:Google 正在试图同时补上两块短板,一块是编程和推理能力,另一块是全天候 AI Agent。
先说结论
这次爆料可以拆成三层来看:
Gemini 3.5 Pro尚未正式发布,Cappuccino更像是内部检查点或候选版本代号。- 曝光信息显示,新 Gemini 在代码生成、SVG / 交互式 Web 生成、多模态输出上有明显提升。
- Google 同步测试的
Gemini Spark,可能比模型本身更关键,因为它指向 24 小时运行的个人 AI Agent。
换句话说,这不是一条简单的“模型跑分新闻”。它更像是 Google 在 I/O 前释放出的产品路线信号:模型要追赶 GPT-5.5,Agent 要抢占用户工作流入口。
Cappuccino 是什么
36Kr 文章提到,网友 Lentils 放出的消息显示,代号 Cappuccino 的 Gemini 3.5 Pro 检查点已经开始产出。此前社区还在讨论 Gemini 3.2,但最新曝光直接跳到了 3.5。
如果这个命名最终属实,说明 Google 可能希望把下一代 Gemini 包装成一次更大的版本跃迁,而不是普通小版本更新。
需要注意的是,Cappuccino 现在仍应被视为爆料中的内部代号。它不等于 Google 已经公开上线的正式模型,也不代表最终发布名一定就是 Gemini 3.5 Pro。
编程能力为什么是焦点
这次爆料里最受关注的点,是新 Gemini 的编程能力。
36Kr 引述的社区截图和跑分信息显示,新模型在以下任务上表现更强:
- 生成 SVG 与视觉组件。
- 生成交互式 Web 应用。
- 处理动画、3D、可调参数面板等复杂前端输出。
- 逻辑推理和代码生成能力有所提升。
文章还提到,Abacus.AI CEO Bindu Reddy 转述的说法是,3.2 Flash 在编码和推理上接近 GPT-5.5 的水平,同时成本更低。另有媒体信源则认为,新款 Gemini 的整体性能大致追平 GPT-5.5,但未必能带来质变。
这也是为什么要谨慎看待“追平 GPT-5.5”这句话。它更像是不同爆料源和匿名评测中的相对判断,而不是 Google 官方给出的基准测试结论。
为什么 Google 急着补编程
AI 编程已经从开发者工具变成了大模型竞争的核心战场。
OpenAI 有 Codex,Anthropic 有 Claude Code。它们不只服务工程师,也在把产品经理、设计师、运营人员带进“自然语言生成可运行产品”的工作流里。
相比之下,Google 虽然有 Gemini 和 Antigravity,但在开发者心智里一直没有形成同等强度的默认入口。36Kr 文章也提到,Antigravity 在外部市场还没有真正突围,定价、额度提醒和体验稳定性都曾引发社区讨论。
所以新 Gemini 如果要证明自己,编程会是最直接的战场。它不一定只比拼“会不会写代码”,还要比拼能不能稳定产出完整界面、理解复杂需求、调用工具、修复错误并融入真实开发流程。
Spark 可能比 3.5 Pro 更重要
同一波爆料里,Gemini Spark BETA 也被扒出。
根据 TestingCatalog 等信息源的说法,Spark 的定位接近“全天候 AI Agent”:它可以处理收件箱、执行在线任务、管理多步骤工作流,并连接 Google 应用、技能模块、聊天记录、定时任务、登录网站、位置信息等上下文。
这意味着 Spark 不是一个普通聊天入口,而是一个可能长期在线、持续读取上下文并替用户执行任务的系统。
它的吸引力很明显:如果 Google 能把 Gmail、Calendar、Chrome、Android、Workspace 和 Gemini 串起来,Spark 会天然拥有 OpenAI 和 Anthropic 很难复制的分发优势。
但风险也同样明显。36Kr 文章提到,Spark 相关说明中出现了“可能在未经询问的情况下分享信息或完成购买”的表述。哪怕系统设计上会在敏感操作前征求许可,这类 Agent 仍然会带来隐私、授权边界和误操作风险。
这对普通用户意味着什么
如果你只是普通 Gemini 用户,这次爆料真正值得关注的不是模型名,而是三个变化:
第一,Google 可能会继续强化“生成完整结果”的能力。以前用户经常吐槽 Gemini 在视觉生成、SVG、前端页面上容易偷懒,如果新模型能一次给出多个完整方案,体验会明显改善。
第二,编程能力会继续下放到更轻量的模型。爆料里反复提到 Flash 版本在编码、推理和交互式生成上的提升,这意味着未来不一定只有 Pro 模型才能处理复杂任务。
第三,Agent 会变得更主动。Spark 如果发布,Gemini 可能不再只是回答问题,而是开始长期接管邮件、网页、购买、日程和跨应用任务。
这对效率是好消息,对权限管理则是新挑战。
这对开发者意味着什么
开发者更应该关注两个问题。
第一个问题是工具生态。36Kr 文章提到,社区从模型选择器里看到了 MCP Tool Testing 这类未公开入口。如果 Gemini 原生支持 MCP 或第三方工具测试,那么它会更容易接入开发者自己的工具链。
第二个问题是成本和稳定性。即便新 Gemini 在某些基准上追平 GPT-5.5,开发者最终还是会看三件事:实际代码质量、上下文稳定性、价格和额度是否可预期。
过去一年,AI 编程工具竞争已经证明,模型能力只是门票。真正让开发者留下来的,是能不能在日常项目里持续可靠地改代码、跑测试、读上下文、处理边界条件。
现在应该如何看待这条消息
这条消息适合用“强信号、弱确认”来理解。
强信号在于:多个社区线索都指向 Google 正在准备更强的新 Gemini,以及更主动的 Gemini Spark Agent。
弱确认在于:Gemini 3.5 Pro 还没有官方发布,Cappuccino 仍是爆料代号,所谓“追平 GPT-5.5”的说法也需要等 Google 官方基准、第三方评测和真实用户测试来验证。
所以现在最稳妥的判断是:
- 不要把它当成已发布产品。
- 可以把它当成 Google 下一阶段 Gemini 路线的提前预告。
- 重点关注 I/O 或后续官方活动中是否会确认模型命名、API 可用性、价格、上下文窗口、工具调用和 Agent 权限边界。
总结
Gemini 3.5 Pro / Cappuccino 的曝光说明,Google 可能正在为下一代 Gemini 做一次更强势的版本推进。它要补的不是单一能力,而是整个 AI 工作流:模型要更会写代码、生成界面和处理复杂推理,Spark 则要把 Gemini 推向全天候 Agent。
但在官方发布前,所有跑分和截图都只能作为线索。真正决定 Gemini 3.5 Pro 能否翻身的,不是代号是否好听,而是它能否在真实开发、真实办公和真实多步骤任务里稳定胜出。
参考链接: