gemini3.us
Rilasciato il 3 marzo 2026

Gemini 3.1 Flash Lite

Il modello Gemini 3 più veloce ed economico di Google

2,5× più veloce di Gemini 2.5 Flash • 363 token/sec • Contesto 1M token • Progettato per la scalabilità

Esplora i benchmark
2,5×
Primo token più veloce
363
Token/sec
1M
Contesto token
1/8×
Costo vs Pro

Caratteristiche di Gemini 3.1 Flash Lite

Ottimizzato per velocità, costo e carichi di lavoro di produzione ad alto volume

2,5× più veloce al primo token

Gemini 3.1 Flash Lite raggiunge un tempo al primo token 2,5x più veloce di Gemini 2.5 Flash, ideale per applicazioni in tempo reale e interattive.

Efficienza di costo estrema

Al prezzo di un ottavo del costo di Gemini 3.1 Pro, è l'opzione più conveniente per distribuzioni di produzione ad alto volume.

363 token al secondo

Raggiunge 363 token/sec di velocità di output, il 45% più veloce dei 249 token/sec di Gemini 2.5 Flash, mantenendo qualità simile o migliore.

Input multimodale completo

Supporta input di testo, immagine, video, audio e PDF con una finestra di contesto di 1M token. Solo output di testo.

Livelli di pensiero dinamici

Pensiero adattivo che adatta il calcolo alla complessità del compito, dalle risposte istantanee al ragionamento profondo.

Attività agentiche ad alto volume

Progettato per pipeline agentiche, estrazione semplice di dati, classificazione e traduzione su larga scala.

Prestazioni di Gemini 3.1 Flash Lite

Il più veloce ed economico della serie Gemini 3

Velocità e throughput

Tempo al primo token
2,5× più veloce di Gemini 2.5 Flash
2.5×
Velocità di output
363 token/sec vs 249 token/sec
363/s
Miglioramento della velocità
45% più veloce di Gemini 2.5 Flash
+45%
Profilo di latenza
Ottimizzato per applicazioni a bassa latenza
Low

Efficienza di costo

Costo vs Gemini 3.1 Pro
Un ottavo del prezzo
1/8×
Prezzo di input
Costo estremamente basso per 1M token
Low
Adeguatezza per la scalabilità
Progettato per milioni di richieste/giorno
M+/day
Ottimizzazione del budget
Miglior rapporto qualità-prezzo nella serie Gemini 3
Best

Contesto e multimodale

Finestra di contesto
1.048.576 token di input
1M
Limite token di output
65.536 token per risposta
65K
Tipi di input
Testo, immagine, video, audio, PDF
5
API batch
Supporta l'elaborazione in blocco

Capacità supportate

Chiamata di funzioni
Supportato
Grounding di ricerca
Supportato
Esecuzione di codice
Supportato
Output strutturati
Supportato

Risultati dei benchmark di Gemini 3.1 Flash Lite

Supera Gemini 2.5 Flash in ogni benchmark chiave — a costi inferiori

BenchmarkPunteggioDescrizione
Arena Elo1432Classifica delle preferenze umane (Arena.ai) — supera i modelli della sua categoria
Indice di intelligenza34Indice di intelligenza Artificial Analysis — +12 punti rispetto a Gemini 2.5 Flash-Lite
GPQA Diamond86.9%Conoscenza scientifica a livello di dottorato — supera Gemini 2.5 Flash (82.8%), Claude 4.5 Haiku (73.0%), GPT-5 mini (82.3%)
MMMU-Pro76.8%Comprensione e ragionamento multimodale — supera Claude Opus 4.6, Kimi K2.5 e GPT-5 mini (74.1%)
Video-MMMU84.8%Acquisizione di conoscenze dai video — supera GPT-5 mini (82.5%) e Grok 4.1 Fast (74.6%)
Humanity's Last Exam16.0%Ragionamento accademico su testo e multimodale — paragonabile a GPT-5 mini (16.7%)
LiveCodeBench72.0%Generazione di codice (gen–mag 2025) — 2× meglio di Gemini 2.5 Flash-Lite (34.3%)
SimpleQA Verificato43.3%Accuratezza della conoscenza parametrica — 4× meglio di GPT-5 mini (9.5%) e Claude 4.5 Haiku (5.5%)
MMMLU (Multilingue)88.9%Q&A multilingue — supera GPT-5 mini (84.9%), Claude 4.5 Haiku (83.0%), Grok 4.1 Fast (86.8%)
CharXiv Reasoning73.2%Sintesi di informazioni da grafici complessi — supera Gemini 2.5 Flash (63.7%) e Claude 4.5 Haiku (61.7%)
MRCR v2 (128k)60.1%Prestazioni su contesto lungo (8 aghi, media 128k) — supera GPT-5 mini (52.5%) e Claude 4.5 Haiku (35.3%)
Velocità di output363 tok/s45% più veloce di Gemini 2.5 Flash (249 tok/s) — il più veloce nella sua fascia di prezzo
Prezzo input$0.25/1MPer milione di token in input — competitivo con GPT-5 mini ($0.25/1M)
Prezzo output$1.50/1MPer milione di token in output — significativamente più economico di Claude 4.5 Haiku ($5.00/1M)

Fonte: Artificial Analysis & Arena.ai Leaderboard

Informazioni su Gemini 3.1 Flash Lite

Gemini 3.1 Flash Lite è il modello più veloce ed economico della serie Gemini 3 di Google DeepMind, rilasciato il 3 marzo 2026. Ottimizzato per attività ad alto throughput e sensibili alla latenza come traduzione, classificazione ed estrazione semplice di dati. Con 363 token/sec di throughput e una finestra di contesto di 1M token, offre prestazioni eccezionali a una frazione del costo.

Avviso importante: Gemini3.us è una piattaforma indipendente della comunità di appassionati e sviluppatori. Non siamo affiliati, approvati o ufficialmente connessi a Google LLC. Forniamo accesso a pagamento ai servizi ufficiali dell'API Gemini di Google per supportare la nostra infrastruttura e le operazioni.

Inizia con Gemini 3.1 Flash Lite

Sperimenta il modello più veloce ed economico della serie Gemini 3