Lanzado el 3 de marzo de 2026

Gemini 3.1 Flash Lite

El modelo Gemini 3 más rápido y rentable de Google

2.5× más rápido que Gemini 2.5 Flash • 363 tokens/seg • Contexto de 1M tokens • Diseñado para escala

Ver benchmarks

2.5×

Primer token más rápido

363

Tokens/seg

Contexto de tokens

1/8×

Costo vs Pro

Características de Gemini 3.1 Flash Lite

Optimizado para velocidad, costo y cargas de trabajo de producción de alto volumen

2.5× más rápido en primer token

Gemini 3.1 Flash Lite logra un tiempo de primer token 2.5x más rápido que Gemini 2.5 Flash, ideal para aplicaciones en tiempo real e interactivas.

Eficiencia de costo extrema

Con un precio de un octavo del costo de Gemini 3.1 Pro, es la opción más asequible para implementaciones de producción de alto volumen.

363 tokens por segundo

Alcanza 363 tokens/seg de velocidad de salida, un 45% más rápido que los 249 tokens/seg de Gemini 2.5 Flash, manteniendo calidad similar o mejor.

Entrada multimodal completa

Soporta entradas de texto, imagen, video, audio y PDF con una ventana de contexto de 1M tokens. Solo salida de texto.

Niveles de pensamiento dinámico

Pensamiento adaptativo que ajusta el cómputo a la complejidad de la tarea, desde respuestas instantáneas hasta razonamiento profundo.

Tareas agénticas de alto volumen

Diseñado para pipelines agénticos, extracción simple de datos, clasificación y traducción a gran escala.

Rendimiento de Gemini 3.1 Flash Lite

El más rápido y rentable de la serie Gemini 3

Velocidad y rendimiento

Tiempo al primer token

2.5× más rápido que Gemini 2.5 Flash

2.5×

Velocidad de salida

363 tokens/seg vs 249 tokens/seg

363/s

Mejora de velocidad

45% más rápido que Gemini 2.5 Flash

+45%

Perfil de latencia

Optimizado para aplicaciones de baja latencia

Low

Eficiencia de costo

Costo vs Gemini 3.1 Pro

Un octavo del precio

1/8×

Precio de entrada

Costo extremadamente bajo por 1M tokens

Low

Adecuación para escala

Diseñado para millones de solicitudes/día

M+/day

Optimización de presupuesto

Mejor relación costo-calidad en la serie Gemini 3

Best

Contexto y multimodal

Ventana de contexto

1,048,576 tokens de entrada

Límite de tokens de salida

65,536 tokens por respuesta

65K

Tipos de entrada

Texto, imagen, video, audio, PDF

API por lotes

Compatible con procesamiento masivo

✓

Capacidades soportadas

Llamada a funciones

Compatible

✓

Fundamentación de búsqueda

Compatible

✓

Ejecución de código

Compatible

✓

Salidas estructuradas

Compatible

✓

Resultados de benchmarks de Gemini 3.1 Flash Lite

Supera a Gemini 2.5 Flash en todos los benchmarks clave con menor costo

Benchmark	Puntuación	Descripción
Arena Elo	1432	Ranking de preferencia humana Arena.ai — mejor rendimiento en su clase
Índice de Inteligencia	34	Índice de Inteligencia Artificial Analysis — +12 puntos sobre Gemini 2.5 Flash-Lite
GPQA Diamond	86.9%	Conocimiento científico a nivel doctoral — supera a Gemini 2.5 Flash (82.8%), Claude 4.5 Haiku (73.0%), GPT-5 mini (82.3%)
MMMU-Pro	76.8%	Comprensión y razonamiento multimodal — supera a Claude Opus 4.6, Kimi K2.5 y GPT-5 mini (74.1%)
Video-MMMU	84.8%	Adquisición de conocimiento desde vídeos — supera a GPT-5 mini (82.5%) y Grok 4.1 Fast (74.6%)
Humanity's Last Exam	16.0%	Razonamiento académico en texto y multimodal — comparable a GPT-5 mini (16.7%)
LiveCodeBench	72.0%	Generación de código (ene–may 2025) — 2× mejor que Gemini 2.5 Flash-Lite (34.3%)
SimpleQA Verified	43.3%	Precisión de conocimiento paramétrico — 4× mejor que GPT-5 mini (9.5%) y Claude 4.5 Haiku (5.5%)
MMMLU (Multilingüe)	88.9%	Q&A multilingüe — supera a GPT-5 mini (84.9%), Claude 4.5 Haiku (83.0%), Grok 4.1 Fast (86.8%)
CharXiv Reasoning	73.2%	Síntesis de información de gráficos complejos — supera a Gemini 2.5 Flash (63.7%) y Claude 4.5 Haiku (61.7%)
MRCR v2 (128k)	60.1%	Rendimiento en contexto largo (8-needle, media 128k) — supera a GPT-5 mini (52.5%) y Claude 4.5 Haiku (35.3%)
Velocidad de salida	363 tok/s	45% más rápido que Gemini 2.5 Flash (249 tok/s) — el más rápido en su rango de precio
Precio de entrada	$0.25/1M	Por millón de tokens de entrada — igual que GPT-5 mini ($0.25/1M)
Precio de salida	$1.50/1M	Por millón de tokens de salida — mucho más barato que Claude 4.5 Haiku ($5.00/1M)

Fuente: Artificial Analysis y Arena.ai Leaderboard

Acerca de Gemini 3.1 Flash Lite

Gemini 3.1 Flash Lite es el modelo más rápido y rentable de la serie Gemini 3 de Google DeepMind, lanzado el 3 de marzo de 2026. Está optimizado para tareas de alto rendimiento y sensibles a la latencia como traducción, clasificación y extracción simple de datos. Con 363 tokens/seg de rendimiento y una ventana de contexto de 1M tokens, ofrece un rendimiento excepcional a una fracción del costo.

Aviso importante: Gemini3.us es una plataforma independiente de la comunidad de entusiastas y desarrolladores. No estamos afiliados, respaldados ni conectados oficialmente con Google LLC. Proporcionamos acceso de pago a los servicios oficiales de la API Gemini de Google para apoyar nuestra infraestructura y operaciones.

Comenzar con Gemini 3.1 Flash Lite

Experimenta el modelo más rápido y rentable de la serie Gemini 3