Julkaistu 3. maaliskuuta 2026

Gemini 3.1 Flash Lite

Googlen nopein ja kustannustehokkain Gemini 3 -malli

2,5× nopeampi kuin Gemini 2.5 Flash • 363 tokenia/s • 1M tokenin konteksti • Suunniteltu skaalaukseen

Tutustu vertailuarvoihin

2,5×

Ensimmäinen token nopeammin

363

Tokenia/s

Tokenikonteksti

1/8×

Hinta vs Pro

Gemini 3.1 Flash Liten ominaisuudet

Optimoitu nopeudelle, kustannuksille ja suurivolyymisille tuotantokuormille

2,5× nopeampi ensimmäiseen tokeniin

Gemini 3.1 Flash Lite saavuttaa 2,5x nopeamman ajan ensimmäiseen tokeniin kuin Gemini 2.5 Flash, ihanteellinen reaaliaikaisiin ja interaktiivisiin sovelluksiin.

Äärimmäinen kustannustehokkuus

Hinnaltaan kahdeksasosa Gemini 3.1 Pron kustannuksista, edullisin vaihtoehto suurivolyymisiin tuotantokäyttöönottoihin.

363 tokenia sekunnissa

Saavuttaa 363 tokenia/s tulostusnopeus, 45% nopeampi kuin Gemini 2.5 Flashin 249 tokenia/s, samanlaisella tai paremmalla laadulla.

Täysi multimodaalinen syöte

Tukee teksti-, kuva-, video-, ääni- ja PDF-syötteitä 1M tokenin konteksti-ikkunalla. Vain tekstituloste.

Dynaamiset ajattelutasot

Mukautuva ajattelu, joka sovittaa laskennan tehtävän monimutkaisuuteen, välittömistä vastauksista syvälliseen päättelyyn.

Suurivolyymisia agenttitehtäviä

Suunniteltu agenttiputkistoille, yksinkertaiselle tiedonpoiminnalle, luokittelulle ja käännöksille suuressa mittakaavassa.

Gemini 3.1 Flash Liten suorituskyky

Nopein ja kustannustehokkain Gemini 3 -sarjassa

Nopeus ja läpäisykyky

Aika ensimmäiseen tokeniin

2,5× nopeampi kuin Gemini 2.5 Flash

2.5×

Tulostusnopeus

363 tokenia/s vs 249 tokenia/s

363/s

Nopeuden parannus

45% nopeampi kuin Gemini 2.5 Flash

+45%

Viiveprofiili

Optimoitu matalan viiveen sovelluksiin

Low

Kustannustehokkuus

Hinta vs Gemini 3.1 Pro

Kahdeksasosa hinnasta

1/8×

Syötteen hinta

Erittäin alhainen hinta per 1M tokenia

Low

Soveltuvuus skaalaukseen

Suunniteltu miljoonille pyynnöille/päivä

M+/day

Budjetin optimointi

Paras laatu/hinta-suhde Gemini 3 -sarjassa

Best

Konteksti ja multimodaalisuus

Konteksti-ikkuna

1 048 576 syötetokenia

Tulostetokenien raja

65 536 tokenia per vastaus

65K

Syötetyypit

Teksti, kuva, video, ääni, PDF

Erä-API

Tukee massankäsittelyä

✓

Tuetut ominaisuudet

Funktiokutsut

Tuettu

✓

Hakuankkurointi

Tuettu

✓

Koodin suoritus

Tuettu

✓

Jäsennellyt tulosteet

Tuettu

✓

Gemini 3.1 Flash Lite Benchmark-tulokset

Päihittää Gemini 2.5 Flashin jokaisessa tärkeässä testissä — pienemmillä kustannuksilla

Testi	Tulos	Kuvaus
Arena Elo	1432	Ihmisten preferenssisijoitus (Arena.ai) — päihittää saman painoluokan mallit
Älykkyysindeksi	34	Artificial Analysis -älykkyysindeksi — +12 pistettä Gemini 2.5 Flash-Litestä
GPQA Diamond	86.9%	Tohtorintason tieteellinen tieto — päihittää Gemini 2.5 Flashin (82.8%), Claude 4.5 Haikun (73.0%), GPT-5 minin (82.3%)
MMMU-Pro	76.8%	Multimodaalinen ymmärrys ja päättely — päihittää Claude Opus 4.6:n, Kimi K2.5:n ja GPT-5 minin (74.1%)
Video-MMMU	84.8%	Tiedon hankinta videoista — päihittää GPT-5 minin (82.5%) ja Grok 4.1 Fastin (74.6%)
Humanity's Last Exam	16.0%	Akateeminen päättely tekstin ja multimodaalin kautta — verrattavissa GPT-5 miniin (16.7%)
LiveCodeBench	72.0%	Koodin generointi (tammi–toukokuu 2025) — 2× parempi kuin Gemini 2.5 Flash-Lite (34.3%)
SimpleQA Vahvistettu	43.3%	Parametrisen tiedon tarkkuus — 4× parempi kuin GPT-5 mini (9.5%) ja Claude 4.5 Haiku (5.5%)
MMMLU (Monikielinen)	88.9%	Monikielinen kysymys-vastaus — päihittää GPT-5 minin (84.9%), Claude 4.5 Haikun (83.0%), Grok 4.1 Fastin (86.8%)
CharXiv Reasoning	73.2%	Tiedon synteesi monimutkaisista kaavioista — päihittää Gemini 2.5 Flashin (63.7%) ja Claude 4.5 Haikun (61.7%)
MRCR v2 (128k)	60.1%	Pitkän kontekstin suorituskyky (8 neulaa, keskiarvo 128k) — päihittää GPT-5 minin (52.5%) ja Claude 4.5 Haikun (35.3%)
Tulostausnopeus	363 tok/s	45% nopeampi kuin Gemini 2.5 Flash (249 tok/s) — nopein hintatasollaan
Syöttöhinta	$0.25/1M	Per miljoona syöttötokenia — kilpailukykyinen GPT-5 minin kanssa ($0.25/1M)
Tulostushinta	$1.50/1M	Per miljoona tulostustokenia — huomattavasti halvempi kuin Claude 4.5 Haiku ($5.00/1M)

Lähde: Artificial Analysis & Arena.ai Leaderboard

Tietoja Gemini 3.1 Flash Litestä

Gemini 3.1 Flash Lite on Google DeepMindin Gemini 3 -sarjan nopein ja kustannustehokkain malli, julkaistu 3. maaliskuuta 2026. Optimoitu suurivolyymisiin, viiveherkkiin tehtäviin kuten käännöksiin, luokitteluun ja yksinkertaiseen tiedonpoimintaan. 363 tokenia/s läpäisykyvyllä ja 1M tokenin konteksti-ikkunalla tarjoaa poikkeuksellisen suorituskyvyn murto-osalla kustannuksista.

Tärkeä huomio: Gemini3.us on riippumaton harrastajien yhteisö- ja kehittäjäalusta. Emme ole sidoksissa, hyväksyttyjä tai virallisesti yhteydessä Google LLC:hen. Tarjoamme maksullisen pääsyn Googlen virallisiin Gemini API -palveluihin tukeaksemme infrastruktuuriamme ja toimintaamme.

Aloita Gemini 3.1 Flash Liten käyttö

Koe Gemini 3 -sarjan nopein ja kustannustehokkain malli