El 12 de junio, Google actualizó el tablero. Gemini 3.5 Flash pasó a disponibilidad general y con él llegó el lanzamiento de Managed Agents en public preview dentro de la Gemini API: una plataforma para desplegar agentes autónomos en la nube sin tener que montar infraestructura propia.
Si llevas tiempo siguiendo el espacio de agentes de IA, este movimiento es relevante. No porque Gemini 3.5 Flash sea el modelo más potente del mercado, sino porque Google acaba de entrar fuerte en la batalla de quién provee el mejor ambiente de ejecución para agentes. La guerra entre LLMs ya no es solo sobre benchmarks.
Qué tiene de nuevo Gemini 3.5 Flash
Flash siempre fue el modelo "para uso real" de Google: más rápido y más barato que Pro, con suficiente capacidad para tareas de agentes y código. La versión 3.5 que acaba de salir en GA se posiciona explícitamente como el modelo de referencia para agentic tasks y coding en producción.
Google lo describe como "la versión más inteligente de Flash para performance sostenida en tareas de agentes". En benchmarks de coding y razonamiento multi-step, Flash 3.5 cierra buena parte de la brecha con Pro. Para quien construye sistemas que van a correr solos 24/7, esa diferencia de velocidad y costo importa más de lo que parece en papel.
Lo relevante para quienes ya están en producción: si usas Flash 2.x, la 3.5 vale el upgrade. Si venías usando Pro por falta de opciones intermedias, ahora tienes una alternativa seria para workloads de alta frecuencia.
Managed Agents: agentes sin infraestructura propia
Acá está la parte más interesante del anuncio. Managed Agents es la respuesta de Google a una pregunta que todos los que construimos con IA llevamos tiempo haciendo: ¿cómo hago que un agente corra en producción sin convertirlo en un proyecto de infraestructura?
La idea es directa: tú defines el comportamiento del agente (tools, memoria, instrucciones del sistema), Google se ocupa de correrlo en un entorno aislado y estable. No necesitas configurar servidores, manejar concurrencia ni montar un store de estado por separado.
Lo que incluye el ambiente managed:
- ▸Estado persistente entre sesiones sin base de datos extra: el agente recuerda el contexto de conversaciones anteriores por defecto.
- ▸Sandbox de Linux aislado donde el agente puede ejecutar código, manipular archivos y hacer llamadas a herramientas en un entorno controlado.
- ▸Integración nativa con Gmail, Drive y Sheets sin conectores adicionales — útil si tu caso de uso vive en el ecosistema Google.
- ▸File Search multimodal: el agente puede buscar en documentos e imágenes usando embeddings de Gemini, directamente desde la API.
Todo esto viene dentro de la misma Gemini API. Sin Vertex AI separado, sin GCP aparte (aunque puedes combinarlo si ya estás ahí). La mayoría de lo que antes requería semanas de setup ahora es configuración en una llamada a la API.
Lo que nadie está diciendo abiertamente: esto es competencia directa a los Assistants de OpenAI y a lo que Anthropic está armando con Claude Code. La guerra entre modelos de lenguaje ya mutó. Ahora es sobre quién provee el mejor entorno de ejecución para agentes en producción.
Cuándo tiene sentido usarlo (y cuándo no)
Honest take: Managed Agents está en public preview. Eso significa que la API puede cambiar, los rate limits son más restrictivos de lo que serán en GA, y probablemente habrá breaking changes. Para explorar y prototipar: perfecto. Para producción crítica con miles de usuarios: yo esperaría el GA o usaría LangGraph para tener más control del estado.
Donde sí lo veo ganando hoy:
- ▸Empresas que ya viven en el ecosistema Google (Gmail, Drive, Sheets) y quieren automatizar flujos internos con IA sin contratar un equipo de infraestructura.
- ▸Prototipos de asistentes con memoria persistente que necesitan salir rápido: en vez de semanas configurando Redis y Postgres para el estado, tienes memoria lista en horas.
- ▸Startups chicas y equipos sin DevOps que no pueden mantener un stack de agentes propio.
Donde LangGraph sigue siendo la apuesta más sólida: sistemas con lógica condicional compleja, flujos que necesitan human-in-the-loop personalizado a nivel de nodo, o proyectos donde el vendor lock-in con Google es un riesgo real para el negocio.
Cómo empezar con agentes en Google Cloud
Si quieres trabajar con este stack en 2026, el recorrido que tiene sentido combina: Gemini Flash 3.5 como cerebro del agente, LangGraph para flujos complejos con control granular del estado, y Managed Agents para el deploy sin infraestructura propia.
Primero, domina LangGraph. Es la base que te da control real de los flujos antes de subir a cualquier plataforma managed. El curso de creación de agentes con LangGraph en DataPath cubre flujos stateful, checkpointing y agentes con memoria desde cero.
Después, el taller de agentes con Google Cloud te lleva directo a Gemini y la infraestructura de Google para deployar agentes reales con herramientas nativas del ecosistema.
Y si tu objetivo es hacer de los agentes tu especialidad — entender las arquitecturas, los frameworks, cómo deployar en múltiples clouds — la ruta de AI Agentic Engineer cubre ese camino de principio a fin: de los fundamentos de agentes hasta producción.



