Rilasciato il 3 marzo 2026

Gemini 3.1 Flash Lite

Il modello Gemini 3 più veloce ed economico di Google

2,5× più veloce di Gemini 2.5 Flash • 363 token/sec • Contesto 1M token • Progettato per la scalabilità

Esplora i benchmark

2,5×

Primo token più veloce

363

Token/sec

Contesto token

1/8×

Costo vs Pro

Caratteristiche di Gemini 3.1 Flash Lite

Ottimizzato per velocità, costo e carichi di lavoro di produzione ad alto volume

2,5× più veloce al primo token

Gemini 3.1 Flash Lite raggiunge un tempo al primo token 2,5x più veloce di Gemini 2.5 Flash, ideale per applicazioni in tempo reale e interattive.

Efficienza di costo estrema

Al prezzo di un ottavo del costo di Gemini 3.1 Pro, è l'opzione più conveniente per distribuzioni di produzione ad alto volume.

363 token al secondo

Raggiunge 363 token/sec di velocità di output, il 45% più veloce dei 249 token/sec di Gemini 2.5 Flash, mantenendo qualità simile o migliore.

Input multimodale completo

Supporta input di testo, immagine, video, audio e PDF con una finestra di contesto di 1M token. Solo output di testo.

Livelli di pensiero dinamici

Pensiero adattivo che adatta il calcolo alla complessità del compito, dalle risposte istantanee al ragionamento profondo.

Attività agentiche ad alto volume

Progettato per pipeline agentiche, estrazione semplice di dati, classificazione e traduzione su larga scala.

Prestazioni di Gemini 3.1 Flash Lite

Il più veloce ed economico della serie Gemini 3

Velocità e throughput

Tempo al primo token

2,5× più veloce di Gemini 2.5 Flash

2.5×

Velocità di output

363 token/sec vs 249 token/sec

363/s

Miglioramento della velocità

45% più veloce di Gemini 2.5 Flash

+45%

Profilo di latenza

Ottimizzato per applicazioni a bassa latenza

Low

Efficienza di costo

Costo vs Gemini 3.1 Pro

Un ottavo del prezzo

1/8×

Prezzo di input

Costo estremamente basso per 1M token

Low

Adeguatezza per la scalabilità

Progettato per milioni di richieste/giorno

M+/day

Ottimizzazione del budget

Miglior rapporto qualità-prezzo nella serie Gemini 3

Best

Contesto e multimodale

Finestra di contesto

1.048.576 token di input

Limite token di output

65.536 token per risposta

65K

Tipi di input

Testo, immagine, video, audio, PDF

API batch

Supporta l'elaborazione in blocco

✓

Capacità supportate

Chiamata di funzioni

Supportato

✓

Grounding di ricerca

Supportato

✓

Esecuzione di codice

Supportato

✓

Output strutturati

Supportato

✓

Risultati dei benchmark di Gemini 3.1 Flash Lite

Supera Gemini 2.5 Flash in ogni benchmark chiave — a costi inferiori

Benchmark	Punteggio	Descrizione
Arena Elo	1432	Classifica delle preferenze umane (Arena.ai) — supera i modelli della sua categoria
Indice di intelligenza	34	Indice di intelligenza Artificial Analysis — +12 punti rispetto a Gemini 2.5 Flash-Lite
GPQA Diamond	86.9%	Conoscenza scientifica a livello di dottorato — supera Gemini 2.5 Flash (82.8%), Claude 4.5 Haiku (73.0%), GPT-5 mini (82.3%)
MMMU-Pro	76.8%	Comprensione e ragionamento multimodale — supera Claude Opus 4.6, Kimi K2.5 e GPT-5 mini (74.1%)
Video-MMMU	84.8%	Acquisizione di conoscenze dai video — supera GPT-5 mini (82.5%) e Grok 4.1 Fast (74.6%)
Humanity's Last Exam	16.0%	Ragionamento accademico su testo e multimodale — paragonabile a GPT-5 mini (16.7%)
LiveCodeBench	72.0%	Generazione di codice (gen–mag 2025) — 2× meglio di Gemini 2.5 Flash-Lite (34.3%)
SimpleQA Verificato	43.3%	Accuratezza della conoscenza parametrica — 4× meglio di GPT-5 mini (9.5%) e Claude 4.5 Haiku (5.5%)
MMMLU (Multilingue)	88.9%	Q&A multilingue — supera GPT-5 mini (84.9%), Claude 4.5 Haiku (83.0%), Grok 4.1 Fast (86.8%)
CharXiv Reasoning	73.2%	Sintesi di informazioni da grafici complessi — supera Gemini 2.5 Flash (63.7%) e Claude 4.5 Haiku (61.7%)
MRCR v2 (128k)	60.1%	Prestazioni su contesto lungo (8 aghi, media 128k) — supera GPT-5 mini (52.5%) e Claude 4.5 Haiku (35.3%)
Velocità di output	363 tok/s	45% più veloce di Gemini 2.5 Flash (249 tok/s) — il più veloce nella sua fascia di prezzo
Prezzo input	$0.25/1M	Per milione di token in input — competitivo con GPT-5 mini ($0.25/1M)
Prezzo output	$1.50/1M	Per milione di token in output — significativamente più economico di Claude 4.5 Haiku ($5.00/1M)

Fonte: Artificial Analysis & Arena.ai Leaderboard

Informazioni su Gemini 3.1 Flash Lite

Gemini 3.1 Flash Lite è il modello più veloce ed economico della serie Gemini 3 di Google DeepMind, rilasciato il 3 marzo 2026. Ottimizzato per attività ad alto throughput e sensibili alla latenza come traduzione, classificazione ed estrazione semplice di dati. Con 363 token/sec di throughput e una finestra di contesto di 1M token, offre prestazioni eccezionali a una frazione del costo.

Avviso importante: Gemini3.us è una piattaforma indipendente della comunità di appassionati e sviluppatori. Non siamo affiliati, approvati o ufficialmente connessi a Google LLC. Forniamo accesso a pagamento ai servizi ufficiali dell'API Gemini di Google per supportare la nostra infrastruttura e le operazioni.

Inizia con Gemini 3.1 Flash Lite

Sperimenta il modello più veloce ed economico della serie Gemini 3