gemini3.us
Lanzado el 3 de marzo de 2026

Gemini 3.1 Flash Lite

El modelo Gemini 3 más rápido y rentable de Google

2.5× más rápido que Gemini 2.5 Flash • 363 tokens/seg • Contexto de 1M tokens • Diseñado para escala

Ver benchmarks
2.5×
Primer token más rápido
363
Tokens/seg
1M
Contexto de tokens
1/8×
Costo vs Pro

Características de Gemini 3.1 Flash Lite

Optimizado para velocidad, costo y cargas de trabajo de producción de alto volumen

2.5× más rápido en primer token

Gemini 3.1 Flash Lite logra un tiempo de primer token 2.5x más rápido que Gemini 2.5 Flash, ideal para aplicaciones en tiempo real e interactivas.

Eficiencia de costo extrema

Con un precio de un octavo del costo de Gemini 3.1 Pro, es la opción más asequible para implementaciones de producción de alto volumen.

363 tokens por segundo

Alcanza 363 tokens/seg de velocidad de salida, un 45% más rápido que los 249 tokens/seg de Gemini 2.5 Flash, manteniendo calidad similar o mejor.

Entrada multimodal completa

Soporta entradas de texto, imagen, video, audio y PDF con una ventana de contexto de 1M tokens. Solo salida de texto.

Niveles de pensamiento dinámico

Pensamiento adaptativo que ajusta el cómputo a la complejidad de la tarea, desde respuestas instantáneas hasta razonamiento profundo.

Tareas agénticas de alto volumen

Diseñado para pipelines agénticos, extracción simple de datos, clasificación y traducción a gran escala.

Rendimiento de Gemini 3.1 Flash Lite

El más rápido y rentable de la serie Gemini 3

Velocidad y rendimiento

Tiempo al primer token
2.5× más rápido que Gemini 2.5 Flash
2.5×
Velocidad de salida
363 tokens/seg vs 249 tokens/seg
363/s
Mejora de velocidad
45% más rápido que Gemini 2.5 Flash
+45%
Perfil de latencia
Optimizado para aplicaciones de baja latencia
Low

Eficiencia de costo

Costo vs Gemini 3.1 Pro
Un octavo del precio
1/8×
Precio de entrada
Costo extremadamente bajo por 1M tokens
Low
Adecuación para escala
Diseñado para millones de solicitudes/día
M+/day
Optimización de presupuesto
Mejor relación costo-calidad en la serie Gemini 3
Best

Contexto y multimodal

Ventana de contexto
1,048,576 tokens de entrada
1M
Límite de tokens de salida
65,536 tokens por respuesta
65K
Tipos de entrada
Texto, imagen, video, audio, PDF
5
API por lotes
Compatible con procesamiento masivo

Capacidades soportadas

Llamada a funciones
Compatible
Fundamentación de búsqueda
Compatible
Ejecución de código
Compatible
Salidas estructuradas
Compatible

Resultados de benchmarks de Gemini 3.1 Flash Lite

Supera a Gemini 2.5 Flash en todos los benchmarks clave con menor costo

BenchmarkPuntuaciónDescripción
Arena Elo1432Ranking de preferencia humana Arena.ai — mejor rendimiento en su clase
Índice de Inteligencia34Índice de Inteligencia Artificial Analysis — +12 puntos sobre Gemini 2.5 Flash-Lite
GPQA Diamond86.9%Conocimiento científico a nivel doctoral — supera a Gemini 2.5 Flash (82.8%), Claude 4.5 Haiku (73.0%), GPT-5 mini (82.3%)
MMMU-Pro76.8%Comprensión y razonamiento multimodal — supera a Claude Opus 4.6, Kimi K2.5 y GPT-5 mini (74.1%)
Video-MMMU84.8%Adquisición de conocimiento desde vídeos — supera a GPT-5 mini (82.5%) y Grok 4.1 Fast (74.6%)
Humanity's Last Exam16.0%Razonamiento académico en texto y multimodal — comparable a GPT-5 mini (16.7%)
LiveCodeBench72.0%Generación de código (ene–may 2025) — 2× mejor que Gemini 2.5 Flash-Lite (34.3%)
SimpleQA Verified43.3%Precisión de conocimiento paramétrico — 4× mejor que GPT-5 mini (9.5%) y Claude 4.5 Haiku (5.5%)
MMMLU (Multilingüe)88.9%Q&A multilingüe — supera a GPT-5 mini (84.9%), Claude 4.5 Haiku (83.0%), Grok 4.1 Fast (86.8%)
CharXiv Reasoning73.2%Síntesis de información de gráficos complejos — supera a Gemini 2.5 Flash (63.7%) y Claude 4.5 Haiku (61.7%)
MRCR v2 (128k)60.1%Rendimiento en contexto largo (8-needle, media 128k) — supera a GPT-5 mini (52.5%) y Claude 4.5 Haiku (35.3%)
Velocidad de salida363 tok/s45% más rápido que Gemini 2.5 Flash (249 tok/s) — el más rápido en su rango de precio
Precio de entrada$0.25/1MPor millón de tokens de entrada — igual que GPT-5 mini ($0.25/1M)
Precio de salida$1.50/1MPor millón de tokens de salida — mucho más barato que Claude 4.5 Haiku ($5.00/1M)

Fuente: Artificial Analysis y Arena.ai Leaderboard

Acerca de Gemini 3.1 Flash Lite

Gemini 3.1 Flash Lite es el modelo más rápido y rentable de la serie Gemini 3 de Google DeepMind, lanzado el 3 de marzo de 2026. Está optimizado para tareas de alto rendimiento y sensibles a la latencia como traducción, clasificación y extracción simple de datos. Con 363 tokens/seg de rendimiento y una ventana de contexto de 1M tokens, ofrece un rendimiento excepcional a una fracción del costo.

Aviso importante: Gemini3.us es una plataforma independiente de la comunidad de entusiastas y desarrolladores. No estamos afiliados, respaldados ni conectados oficialmente con Google LLC. Proporcionamos acceso de pago a los servicios oficiales de la API Gemini de Google para apoyar nuestra infraestructura y operaciones.

Comenzar con Gemini 3.1 Flash Lite

Experimenta el modelo más rápido y rentable de la serie Gemini 3