Gemini 3.1 Flash Lite
El modelo Gemini 3 más rápido y rentable de Google
2.5× más rápido que Gemini 2.5 Flash • 363 tokens/seg • Contexto de 1M tokens • Diseñado para escala
Características de Gemini 3.1 Flash Lite
Optimizado para velocidad, costo y cargas de trabajo de producción de alto volumen
2.5× más rápido en primer token
Gemini 3.1 Flash Lite logra un tiempo de primer token 2.5x más rápido que Gemini 2.5 Flash, ideal para aplicaciones en tiempo real e interactivas.
Eficiencia de costo extrema
Con un precio de un octavo del costo de Gemini 3.1 Pro, es la opción más asequible para implementaciones de producción de alto volumen.
363 tokens por segundo
Alcanza 363 tokens/seg de velocidad de salida, un 45% más rápido que los 249 tokens/seg de Gemini 2.5 Flash, manteniendo calidad similar o mejor.
Entrada multimodal completa
Soporta entradas de texto, imagen, video, audio y PDF con una ventana de contexto de 1M tokens. Solo salida de texto.
Niveles de pensamiento dinámico
Pensamiento adaptativo que ajusta el cómputo a la complejidad de la tarea, desde respuestas instantáneas hasta razonamiento profundo.
Tareas agénticas de alto volumen
Diseñado para pipelines agénticos, extracción simple de datos, clasificación y traducción a gran escala.
Rendimiento de Gemini 3.1 Flash Lite
El más rápido y rentable de la serie Gemini 3
Velocidad y rendimiento
Eficiencia de costo
Contexto y multimodal
Capacidades soportadas
Resultados de benchmarks de Gemini 3.1 Flash Lite
Supera a Gemini 2.5 Flash en todos los benchmarks clave con menor costo
| Benchmark | Puntuación | Descripción |
|---|---|---|
| Arena Elo | 1432 | Ranking de preferencia humana Arena.ai — mejor rendimiento en su clase |
| Índice de Inteligencia | 34 | Índice de Inteligencia Artificial Analysis — +12 puntos sobre Gemini 2.5 Flash-Lite |
| GPQA Diamond | 86.9% | Conocimiento científico a nivel doctoral — supera a Gemini 2.5 Flash (82.8%), Claude 4.5 Haiku (73.0%), GPT-5 mini (82.3%) |
| MMMU-Pro | 76.8% | Comprensión y razonamiento multimodal — supera a Claude Opus 4.6, Kimi K2.5 y GPT-5 mini (74.1%) |
| Video-MMMU | 84.8% | Adquisición de conocimiento desde vídeos — supera a GPT-5 mini (82.5%) y Grok 4.1 Fast (74.6%) |
| Humanity's Last Exam | 16.0% | Razonamiento académico en texto y multimodal — comparable a GPT-5 mini (16.7%) |
| LiveCodeBench | 72.0% | Generación de código (ene–may 2025) — 2× mejor que Gemini 2.5 Flash-Lite (34.3%) |
| SimpleQA Verified | 43.3% | Precisión de conocimiento paramétrico — 4× mejor que GPT-5 mini (9.5%) y Claude 4.5 Haiku (5.5%) |
| MMMLU (Multilingüe) | 88.9% | Q&A multilingüe — supera a GPT-5 mini (84.9%), Claude 4.5 Haiku (83.0%), Grok 4.1 Fast (86.8%) |
| CharXiv Reasoning | 73.2% | Síntesis de información de gráficos complejos — supera a Gemini 2.5 Flash (63.7%) y Claude 4.5 Haiku (61.7%) |
| MRCR v2 (128k) | 60.1% | Rendimiento en contexto largo (8-needle, media 128k) — supera a GPT-5 mini (52.5%) y Claude 4.5 Haiku (35.3%) |
| Velocidad de salida | 363 tok/s | 45% más rápido que Gemini 2.5 Flash (249 tok/s) — el más rápido en su rango de precio |
| Precio de entrada | $0.25/1M | Por millón de tokens de entrada — igual que GPT-5 mini ($0.25/1M) |
| Precio de salida | $1.50/1M | Por millón de tokens de salida — mucho más barato que Claude 4.5 Haiku ($5.00/1M) |
Fuente: Artificial Analysis y Arena.ai Leaderboard
Acerca de Gemini 3.1 Flash Lite
Gemini 3.1 Flash Lite es el modelo más rápido y rentable de la serie Gemini 3 de Google DeepMind, lanzado el 3 de marzo de 2026. Está optimizado para tareas de alto rendimiento y sensibles a la latencia como traducción, clasificación y extracción simple de datos. Con 363 tokens/seg de rendimiento y una ventana de contexto de 1M tokens, ofrece un rendimiento excepcional a una fracción del costo.
Aviso importante: Gemini3.us es una plataforma independiente de la comunidad de entusiastas y desarrolladores. No estamos afiliados, respaldados ni conectados oficialmente con Google LLC. Proporcionamos acceso de pago a los servicios oficiales de la API Gemini de Google para apoyar nuestra infraestructura y operaciones.
Comenzar con Gemini 3.1 Flash Lite
Experimenta el modelo más rápido y rentable de la serie Gemini 3