Google 在 2026 年 5 月 20 日正式发布 Gemini 3.5 系列。第一款开放使用的是 Gemini 3.5 Flash,定位不是单纯的聊天模型,而是面向 Agent、代码生成和长时间复杂任务执行的模型。
从这次公告看,Google 对 Gemini 3.5 的叙事很明确:模型不只要回答问题,还要能规划、执行、检查,并在多步任务中持续推进工作。
Gemini 3.5 Flash 先行
Gemini 3.5 Flash 已经面向多类用户开放:
- 普通用户可以通过 Gemini 应用和 Google 搜索中的 AI 模式体验。
- 开发者可以通过 Google Antigravity、Google AI Studio、Android Studio 中的 Gemini API 使用。
- 企业用户可以通过 Gemini Enterprise Agent Platform 和 Gemini Enterprise 使用。
Google 同时提到,Gemini 3.5 Pro 仍在开发中,已经在 Google 内部使用,计划在下个月推出。
这说明 3.5 系列会继续保留 Flash 与 Pro 的分层:Flash 更强调速度、成本和可规模化执行,Pro 则更可能面向更复杂、更高能力需求的场景。
重点是 Agent 和代码任务
Google 把 Gemini 3.5 Flash 称为目前最强的 Agent 与代码编写模型之一。公告中提到,它在多项代码和 Agent 基准测试中超过 Gemini 3.1 Pro 的部分成绩,例如 Terminal-Bench 2.1、GDPval-AA、MCP Atlas 和 CharXiv Reasoning。
这些指标本身不是普通用户最需要关心的内容。更重要的是,Google 正在把模型能力往“可执行工作流”上集中:不仅能写代码,还能处理旧项目迁移、复杂应用开发、财务报表整理、数据分析和持续测试。
在 Antigravity 开发架构中,Gemini 3.5 Flash 可以通过多个协作子代理处理大型任务。Google 展示的例子包括解析 AlphaZero 论文并实现可玩的游戏、把旧版代码转换为 Next.js、并行生成城市景观和 UI 方案。
这类能力的方向很清楚:AI 编程工具正在从“生成一段代码”走向“组织多个 Agent 完成一个项目”。
多模态 UI 与图形能力增强
Gemini 3.5 Flash 继承了 Gemini 3 的多模态基础。Google 强调它可以生成更丰富的网页 UI、交互动画和图形内容。
公告中给出的应用场景包括:
- 为研究论文生成交互式动画。
- 根据文字描述生成交互式硬件模型。
- 为学校募款活动生成完整品牌概念。
- 在短时间内为结账流程生成多种 UX 方案。
这部分对开发者和产品团队很有意义。模型不再只是输出文字说明,而是能参与前端原型、交互设计和可视化内容生成。
企业场景:把耗时流程自动化
Google 在公告中列举了多个合作伙伴案例。Shopify 使用子代理分析复杂数据并预测商家增长;Macquarie Bank 测试用 3.5 Flash 阅读超过 100 页的复杂文件,加速开户流程;Salesforce 将其整合到 Agentforce;Ramp 用它改进复杂发票 OCR;Xero 用 AI 代理处理行政流程;Databricks 用自动化工作流监控数据异常并给出修复建议。
这些案例共同指向一个趋势:企业采用大模型时,关注点正在从单次问答转向流程自动化。模型是否便宜、快、能长时间稳定执行,会比单次回答是否惊艳更重要。
Gemini Spark:个人 AI 代理
Google 还公布了 Gemini Spark。它是由 Gemini 3.5 Flash 驱动的个人 AI 代理,目标是在用户引导下长期运行并主动执行任务。
Gemini Spark 已经开始面向受信任测试人员推出,Google 计划在下周向美国 Google AI Ultra 订阅用户开放 Beta 测试。
这部分值得关注。Google 搜索、Gemini 应用、Android、Workspace 和浏览器生态本来就覆盖大量个人数字生活场景。如果个人 Agent 能与这些入口结合,影响可能比单独的聊天机器人更大。
安全机制继续前移
Google 表示 Gemini 3.5 按照 Frontier Safety Framework 开发,并强化了信息安全和 CBRN 相关防护。公告还提到使用可解释性工具,在模型给出回答前帮助检查和理解推理过程。
这说明前沿模型的发布已经不只是能力竞赛。越是强调 Agent、自动执行和长任务,安全控制、误拒率、有害输出防护和可解释性就越重要。
怎么看 Gemini 3.5
Gemini 3.5 Flash 的意义不只是“又一个新模型发布”。它更像是 Google 对下一阶段 AI 产品形态的集中押注:模型要能调用工具、拆分任务、协作执行、生成 UI,并进入个人和企业工作流。
对开发者来说,值得关注的是 Google Antigravity、AI Studio、Gemini API 和 Android Studio 中的实际体验。对企业来说,重点是它能否在真实流程中稳定减少人工操作,而不是只看 benchmark。
Gemini 3.5 Pro 还没有正式开放。等 Pro 发布后,Flash 与 Pro 在能力、价格、速度和上下文处理上的差异,才会决定它们各自更适合哪些生产场景。
参考来源: