El modelo Flash que dejó atrás al Pro
En la familia Gemini, la lógica siempre fue clara: los modelos Flash son rápidos y económicos, los modelos Pro son más inteligentes pero más lentos y caros. Con Gemini 3.5 Flash, Google rompió esa regla.
Presentado el 19 de mayo de 2026 en Google I/O, Gemini 3.5 Flash supera a Gemini 3.1 Pro en benchmarks de razonamiento, código y tareas multimodales — y lo hace a mayor velocidad y a menor costo de API. Para los usuarios de la app Gemini, la noticia es todavía mejor: sigue siendo completamente gratis.
Resumen rápido: Gemini 3.5 Flash es el modelo principal de Google desde mayo 2026. Supera a Gemini 3.1 Pro, soporta 2 millones de tokens de contexto, es multimodal nativo (texto, imágenes, audio, video) y cuesta $1.50/$9 por 1M tokens en la API. Disponible gratis en la app Gemini.
Si ya usas Gemini y quieres saber qué cambia concretamente, ve a la sección de novedades. Si llegas desde Claude o ChatGPT y evalúas si cambiar, el comparativo de benchmarks es el lugar de partida.
¿Qué es Gemini 3.5 Flash?
Gemini 3.5 Flash es el modelo de lenguaje de última generación de Google DeepMind, lanzado en el Google I/O 2026 como el nuevo referente de la familia Gemini. Es multimodal por diseño: entiende y genera texto, imágenes, audio y video sin necesidad de configuración adicional.
En junio de 2026, la familia Gemini queda organizada así:
- Gemini 2.0 Flash — el modelo ultra-rápido y económico; $0.10/$0.40 por 1M tokens; ideal para volumen alto y automatización básica
- Gemini 3.1 Flash — equilibrio velocidad/calidad de la generación anterior; sigue disponible en API
- Gemini 3.1 Pro — el antiguo modelo premium; superado por 3.5 Flash en rendimiento
- Gemini 3.5 Flash — el nuevo modelo principal; mejor relación calidad-precio; el que usa la app Gemini gratis
El ID de API es gemini-3.5-flash. Disponible en la API de Google AI Studio, Vertex AI (Google Cloud) y en los productos de Google Workspace con plan AI Premium.
Gemini 3.5 Flash vs 3.1 Pro: qué cambió Nuevo · may 2026
Estas son las diferencias concretas entre el antiguo modelo Pro y el nuevo Flash:
| Característica | Gemini 3.1 Pro | Gemini 3.5 Flash |
|---|---|---|
| Rendimiento general | Alto | Superior (+5–8% en benchmarks) |
| Velocidad de respuesta | Media | Alta (2× más rápido) |
| Precio API — entrada | $1.25 / 1M tokens | $1.50 / 1M tokens |
| Precio API — salida | $5.00 / 1M tokens | $9.00 / 1M tokens (más potente) |
| Contexto máximo | 2 millones de tokens | 2 millones de tokens |
| Multimodal nativo | ✓ | ✓ Mejorado |
| Disponible gratis (app) | ✓ (límite) | ✓ Predeterminado |
La conclusión práctica: salvo que tengas flujos ya optimizados con Gemini 3.1 Pro, no tiene sentido no migrar a 3.5 Flash. El costo de entrada sube levemente ($1.25 → $1.50), pero el salto en calidad lo compensa — y el costo de salida es proporcionalmente menor cuando el modelo resuelve tareas en menos tokens.
Qué puede hacer Gemini 3.5 Flash
Texto y razonamiento extendido
Gemini 3.5 Flash mejora respecto a sus predecesores en tareas de razonamiento en múltiples pasos: matemáticas, análisis lógico, resolución de problemas complejos. También sobresale en textos largos: puede redactar artículos, guiones o informes manteniendo coherencia a lo largo de miles de palabras.
Visión y análisis de imágenes
El modelo puede analizar imágenes, extraer texto de capturas de pantalla, interpretar gráficas y describir escenas. A diferencia de versiones anteriores, 3.5 Flash puede razonar sobre el contenido visual — no solo describir — lo que lo hace útil para revisar documentos escaneados, analizar diagramas técnicos o comparar imágenes.
Audio y video nativo
Gemini 3.5 Flash mantiene las capacidades de comprensión de audio y video de la familia Gemini. Puede transcribir y resumir grabaciones de audio, analizar segmentos de video para extraer información clave y procesar contenido multimedia sin herramientas externas adicionales.
Contexto de 2 millones de tokens
La ventana de contexto de 2 millones de tokens es la más grande disponible entre los modelos de uso general. En términos prácticos, esto equivale a analizar ~1.500 páginas de texto, un repositorio de código completo o una transcripción de muchas horas de audio en una sola consulta. Para investigación, auditorías de código o análisis de documentos extensos, esta capacidad no tiene equivalente directo en Claude ni en ChatGPT.
Cómo acceder a Gemini 3.5 Flash
Gratis — app Gemini y Google Search
La forma más sencilla: entra a gemini.google.com con tu cuenta de Google. Gemini 3.5 Flash es el modelo predeterminado en el plan gratuito. También está integrado en Google Search a través de AI Mode (disponible en la mayoría de países de LATAM). Sin tarjeta de crédito, sin suscripción.
Google One AI Premium — $22/mes
El plan de pago de Google incluye Gemini Advanced (acceso extendido a 3.5 Flash sin throttling), integración nativa con Gmail, Docs y Sheets, historial de conversaciones extendido y 2TB de almacenamiento en Google Drive. Para usuarios de Google Workspace en entornos empresariales, este plan es la opción más integrada del mercado.
API — Google AI Studio y Vertex AI
Los desarrolladores acceden a Gemini 3.5 Flash con el modelo ID gemini-3.5-flash a través de Google AI Studio (para proyectos individuales y prototipos) o Vertex AI (para despliegues empresariales con mayor control). El precio es $1.50 por 1M tokens de entrada y $9 por 1M tokens de salida. Google AI Studio ofrece cuota gratuita mensual para pruebas.
Benchmarks: Gemini 3.5 Flash vs la competencia
¿Cómo se posiciona Gemini 3.5 Flash frente a Claude Sonnet 4.6 y GPT-5.5 Instant, los modelos de nivel medio-alto de Anthropic y OpenAI?
| Métrica | Gemini 3.5 Flash | Claude Sonnet 4.6 | GPT-5.5 Instant |
|---|---|---|---|
| MMLU (razonamiento) | 90.3% | 88.7% | 89.5% |
| HumanEval (código) | 86% | 87% | 88% |
| MATH (matemáticas) | 85% | 83% | 85% |
| Velocidad (tokens/s) | Muy alta | Alta | Alta |
| Contexto máximo | 2M tokens | 1M tokens (beta) | 128K tokens |
| Precio API (in/out) | $1.50 / $9 | $3 / $15 | $5 / $30 |
| Plan gratuito | ✓ Generoso | ✓ Con límites | ✓ Con límites |
Qué significa esto en la práctica: para tareas que requieren procesar documentos extensos, análisis multimodal o proyectos con alto volumen de tokens, Gemini 3.5 Flash ofrece la mejor relación calidad-precio del mercado. Para código puro de alta complejidad, Claude Sonnet 4.6 y GPT-5.5 Instant son marginalmente superiores. Para uso general de escritura, razonamiento y conversación, los tres compiten en un nivel muy similar.
¿Para quién es Gemini 3.5 Flash en LATAM?
Usas Docs, Sheets o Gmail en el trabajo. La integración nativa de Gemini 3.5 Flash con toda la suite de Google no tiene equivalente directo en Claude ni ChatGPT. El plan Advanced ($22/mes) justifica el costo si ya pagas Google One.
Necesitas procesar documentos extensos: informes de 200 páginas, bases de datos completas, repositorios con decenas de archivos. El contexto de 2M tokens es tu ventaja. Ningún otro modelo de uso general llega a ese límite.
Construyes aplicaciones donde el costo de API importa. Con $1.50/$9 por 1M tokens, Gemini 3.5 Flash es la opción más económica entre los modelos de alta calidad — más barato que Claude Sonnet 4.6 (2× más) o GPT-5.5 Instant (3×).
Nota para LATAM: Gemini está disponible sin restricciones geográficas en Colombia, México, Argentina, Chile, Perú y demás países de la región. La app funciona en español de forma nativa, y AI Mode de Google Search (que usa Gemini 3.5 Flash) ya está activo en la mayoría de mercados hispanohablantes.
Preguntas frecuentes
Conclusión
Gemini 3.5 Flash redefine lo que puede esperarse del tier "Flash" de Google. Al superar a Gemini 3.1 Pro en rendimiento mientras mantiene velocidad alta y costo bajo, consolida a Gemini como la opción más eficiente del mercado para usuarios que priorizan el contexto largo, la integración con Google y el precio de API.
Para usuarios de LATAM que ya están en el ecosistema de Google —Workspace, Drive, Gmail— la integración nativa hace que el plan Advanced valga la pena. Para desarrolladores, la API a $1.50/$9 es la opción más competitiva entre los modelos de alta calidad disponibles hoy.
¿Quieres comparar Gemini 3.5 Flash con Claude Opus 4.8 y GPT-5.5 Instant según tu caso de uso específico? Usa nuestro comparador gratuito:
Compara modelos por rendimiento, precio y caso de uso — gratis, sin registro.
Abrir comparador →