Filtración de Gemini 3.5 Pro: con nombre en clave Cappuccino, Google intenta recuperar ritmo en coding y agentes

Resumen de la filtración de 36Kr / Xinzhiyuan sobre Gemini 3.5 Pro y Gemini Spark: el modelo con nombre en clave Cappuccino aún no ha sido lanzado oficialmente, pero capturas de la comunidad, benchmarks anónimos y fuentes de medios sugieren que Google está reforzando coding, razonamiento, generación multimodal y agentes always-on.

Google todavía no ha lanzado oficialmente Gemini 3.5 Pro.

La información disponible por ahora proviene sobre todo de capturas de comunidades de desarrolladores, benchmarks anónimos, filtradores y reportes de medios. El 15 de mayo de 2026, 36Kr / Xinzhiyuan publicó que un checkpoint de la próxima generación de Gemini podría tener el nombre interno Cappuccino, y que modelos relacionados ya habrían aparecido en comunidades y plataformas de evaluación.

Esta información no debe tratarse como un lanzamiento oficial, pero sí muestra una dirección clara: Google intenta cubrir dos brechas a la vez, coding y razonamiento por un lado, y agentes de IA always-on por el otro.

Conclusión rápida

Esta filtración puede leerse en tres capas:

  1. Gemini 3.5 Pro aún no ha sido lanzado oficialmente, y Cappuccino parece más un checkpoint interno o una build candidata.
  2. La información filtrada sugiere que el nuevo Gemini mejora en generación de código, generación SVG / web interactiva y salida multimodal.
  3. La prueba paralela de Gemini Spark por parte de Google puede ser más importante que el modelo en sí, porque apunta a un agente personal de IA funcionando 24 horas.

En otras palabras, no es solo una historia de benchmarks. Parece más una señal de roadmap antes de Google I/O: el modelo necesita alcanzar a GPT-5.5, mientras la capa de agentes necesita capturar flujos de trabajo de usuarios.

Qué es Cappuccino

El artículo de 36Kr menciona que, según una publicación de Lentils, el checkpoint de Gemini 3.5 Pro con nombre en clave Cappuccino ya habría empezado a producirse. La comunidad todavía hablaba de Gemini 3.2 horas antes, pero la filtración más reciente saltó directamente a 3.5.

Si ese nombre termina siendo correcto, Google podría querer presentar el próximo Gemini como un salto de versión más grande, no como una actualización menor.

Por ahora, Cappuccino debe tratarse como un nombre interno filtrado. No significa que Google haya lanzado públicamente el modelo final, ni garantiza que el nombre de lanzamiento vaya a ser Gemini 3.5 Pro.

Por qué el coding es el foco

La parte más comentada de la filtración es la capacidad de coding del nuevo Gemini.

Según capturas y supuestos benchmarks citados por 36Kr, el nuevo modelo parece más fuerte en:

  • Generación de SVG y componentes visuales.
  • Generación de aplicaciones web interactivas.
  • Manejo de animación, 3D, paneles de parámetros ajustables y otras salidas frontend complejas.
  • Mejoras en razonamiento lógico y generación de código.

El artículo también cita a Bindu Reddy, CEO de Abacus.AI, diciendo que 3.2 Flash se acerca a GPT-5.5 en coding y razonamiento, con un coste mucho menor. Otras fuentes de medios creen que el nuevo Gemini se ubica aproximadamente en el nivel de GPT-5.5, aunque quizá no represente un salto cualitativo.

Por eso conviene leer con cautela la frase “alcanza a GPT-5.5”. Se parece más a un juicio relativo basado en filtraciones y pruebas anónimas que a un resultado oficial de benchmark de Google.

Por qué Google necesita ponerse al día en coding

El AI coding pasó de ser una categoría de herramientas para desarrolladores a ocupar el centro de la competencia entre modelos fundacionales.

OpenAI tiene Codex y Anthropic tiene Claude Code. No solo sirven a ingenieros: también llevan a product managers, diseñadores y equipos de operaciones a flujos donde el lenguaje natural produce productos ejecutables.

En comparación, Google tiene Gemini y Antigravity, pero no ha logrado formar el mismo punto de entrada predeterminado en la mente de los desarrolladores. El artículo de 36Kr también señala que Antigravity no ha logrado despegar claramente en el mercado externo, y que precios, avisos de cuota y estabilidad de experiencia han generado discusión en la comunidad.

Así que, si el nuevo Gemini necesita demostrar algo, coding será el campo de batalla más directo. La pregunta no es solo si puede escribir código, sino si puede producir interfaces completas de forma estable, entender requisitos complejos, llamar herramientas, corregir errores e integrarse en flujos reales de desarrollo.

Spark puede importar más que 3.5 Pro

En la misma ola de filtraciones también apareció Gemini Spark BETA.

Según TestingCatalog y otras fuentes, Spark se posiciona como un agente de IA always-on: puede procesar la bandeja de entrada, ejecutar tareas online, gestionar flujos de varios pasos y conectar contexto de apps de Google, módulos de habilidades, historial de chats, tareas programadas, sitios con sesión iniciada e información de ubicación.

Eso significa que Spark no es una entrada de chat normal. Podría ser un sistema que permanece online, lee contexto de forma continua y ejecuta tareas por el usuario.

El atractivo es obvio: si Google puede conectar Gmail, Calendar, Chrome, Android, Workspace y Gemini, Spark tendrá una ventaja de distribución difícil de copiar para OpenAI y Anthropic.

El riesgo también es obvio. El artículo de 36Kr menciona una descripción de Spark según la cual podría compartir información o completar compras sin preguntar. Aunque el sistema esté diseñado para pedir permiso antes de operaciones sensibles, este tipo de agente sigue planteando riesgos de privacidad, límites de autorización y acciones accidentales.

Qué significa para usuarios comunes

Si eres un usuario normal de Gemini, lo más importante de esta filtración no es el nombre del modelo, sino tres cambios.

Primero, Google puede seguir reforzando la capacidad de producir resultados completos. Antes, usuarios se quejaban de que Gemini podía ser perezoso en generación visual, SVG y páginas frontend. Si el nuevo modelo puede generar varias propuestas completas en una sola pasada, la experiencia mejorará de forma visible.

Segundo, la capacidad de coding seguirá bajando a modelos más ligeros. La filtración menciona varias veces mejoras de Flash en coding, razonamiento y generación interactiva, lo que significa que en el futuro no siempre hará falta un modelo Pro para tareas complejas.

Tercero, los agentes serán más proactivos. Si Spark se lanza, Gemini podría dejar de limitarse a responder preguntas y empezar a asumir correo, web, compras, calendario y tareas entre apps durante periodos largos.

Eso es bueno para la eficiencia, pero crea un nuevo desafío de gestión de permisos.

Qué significa para desarrolladores

Los desarrolladores deberían vigilar dos cuestiones.

La primera es el ecosistema de herramientas. El artículo de 36Kr dice que la comunidad vio una entrada no publicada llamada MCP Tool Testing en el selector de modelos. Si Gemini soporta MCP o pruebas de herramientas de terceros de forma nativa, será más fácil conectarlo a las toolchains propias de los desarrolladores.

La segunda es coste y estabilidad. Aunque el nuevo Gemini alcance a GPT-5.5 en algunos benchmarks, los desarrolladores acabarán mirando tres cosas: calidad real del código, estabilidad del contexto, y si precios y cuotas son predecibles.

El último año de competencia en herramientas de AI coding ha demostrado que la capacidad del modelo es solo el billete de entrada. Lo que retiene a los desarrolladores es si la herramienta puede editar código, ejecutar tests, leer contexto y manejar casos límite de forma fiable en proyectos diarios.

Cómo leer esta noticia ahora

Esta noticia se entiende mejor como “señal fuerte, confirmación débil”.

La señal fuerte es que múltiples pistas comunitarias apuntan a que Google prepara un Gemini más fuerte y un Gemini Spark Agent más proactivo.

La confirmación débil es que Gemini 3.5 Pro aún no ha sido lanzado oficialmente, Cappuccino sigue siendo un nombre filtrado, y la afirmación de que “alcanza a GPT-5.5” necesita validación con benchmarks oficiales de Google, pruebas de terceros y experiencia real de usuarios.

La lectura más prudente por ahora:

  • No tratarlo como un producto ya lanzado.
  • Tratarlo como una vista previa temprana de la próxima dirección de Gemini.
  • Observar si I/O u otros eventos oficiales confirman el nombre del modelo, disponibilidad de API, precios, ventana de contexto, tool calling y límites de permisos del agente.

Resumen

La exposición de Gemini 3.5 Pro / Cappuccino sugiere que Google podría estar preparando un empuje más fuerte para la próxima generación de Gemini. No intenta corregir una sola capacidad aislada, sino todo un flujo de trabajo de IA: el modelo debe escribir mejor código, generar interfaces y manejar razonamiento complejo, mientras Spark empuja Gemini hacia un agente always-on.

Pero antes de un lanzamiento oficial, todos los benchmarks y capturas siguen siendo pistas. Lo que decidirá si Gemini 3.5 Pro puede recuperar impulso no será si el nombre en clave suena bien, sino si puede ganar de forma fiable en desarrollo real, trabajo de oficina real y tareas reales de varios pasos.

Referencias:

记录并分享
Creado con Hugo
Tema Stack diseñado por Jimmy