Gemini 3.1 Flash Lite
Googlen nopein ja kustannustehokkain Gemini 3 -malli
2,5× nopeampi kuin Gemini 2.5 Flash • 363 tokenia/s • 1M tokenin konteksti • Suunniteltu skaalaukseen
Gemini 3.1 Flash Liten ominaisuudet
Optimoitu nopeudelle, kustannuksille ja suurivolyymisille tuotantokuormille
2,5× nopeampi ensimmäiseen tokeniin
Gemini 3.1 Flash Lite saavuttaa 2,5x nopeamman ajan ensimmäiseen tokeniin kuin Gemini 2.5 Flash, ihanteellinen reaaliaikaisiin ja interaktiivisiin sovelluksiin.
Äärimmäinen kustannustehokkuus
Hinnaltaan kahdeksasosa Gemini 3.1 Pron kustannuksista, edullisin vaihtoehto suurivolyymisiin tuotantokäyttöönottoihin.
363 tokenia sekunnissa
Saavuttaa 363 tokenia/s tulostusnopeus, 45% nopeampi kuin Gemini 2.5 Flashin 249 tokenia/s, samanlaisella tai paremmalla laadulla.
Täysi multimodaalinen syöte
Tukee teksti-, kuva-, video-, ääni- ja PDF-syötteitä 1M tokenin konteksti-ikkunalla. Vain tekstituloste.
Dynaamiset ajattelutasot
Mukautuva ajattelu, joka sovittaa laskennan tehtävän monimutkaisuuteen, välittömistä vastauksista syvälliseen päättelyyn.
Suurivolyymisia agenttitehtäviä
Suunniteltu agenttiputkistoille, yksinkertaiselle tiedonpoiminnalle, luokittelulle ja käännöksille suuressa mittakaavassa.
Gemini 3.1 Flash Liten suorituskyky
Nopein ja kustannustehokkain Gemini 3 -sarjassa
Nopeus ja läpäisykyky
Kustannustehokkuus
Konteksti ja multimodaalisuus
Tuetut ominaisuudet
Gemini 3.1 Flash Lite Benchmark-tulokset
Päihittää Gemini 2.5 Flashin jokaisessa tärkeässä testissä — pienemmillä kustannuksilla
| Testi | Tulos | Kuvaus |
|---|---|---|
| Arena Elo | 1432 | Ihmisten preferenssisijoitus (Arena.ai) — päihittää saman painoluokan mallit |
| Älykkyysindeksi | 34 | Artificial Analysis -älykkyysindeksi — +12 pistettä Gemini 2.5 Flash-Litestä |
| GPQA Diamond | 86.9% | Tohtorintason tieteellinen tieto — päihittää Gemini 2.5 Flashin (82.8%), Claude 4.5 Haikun (73.0%), GPT-5 minin (82.3%) |
| MMMU-Pro | 76.8% | Multimodaalinen ymmärrys ja päättely — päihittää Claude Opus 4.6:n, Kimi K2.5:n ja GPT-5 minin (74.1%) |
| Video-MMMU | 84.8% | Tiedon hankinta videoista — päihittää GPT-5 minin (82.5%) ja Grok 4.1 Fastin (74.6%) |
| Humanity's Last Exam | 16.0% | Akateeminen päättely tekstin ja multimodaalin kautta — verrattavissa GPT-5 miniin (16.7%) |
| LiveCodeBench | 72.0% | Koodin generointi (tammi–toukokuu 2025) — 2× parempi kuin Gemini 2.5 Flash-Lite (34.3%) |
| SimpleQA Vahvistettu | 43.3% | Parametrisen tiedon tarkkuus — 4× parempi kuin GPT-5 mini (9.5%) ja Claude 4.5 Haiku (5.5%) |
| MMMLU (Monikielinen) | 88.9% | Monikielinen kysymys-vastaus — päihittää GPT-5 minin (84.9%), Claude 4.5 Haikun (83.0%), Grok 4.1 Fastin (86.8%) |
| CharXiv Reasoning | 73.2% | Tiedon synteesi monimutkaisista kaavioista — päihittää Gemini 2.5 Flashin (63.7%) ja Claude 4.5 Haikun (61.7%) |
| MRCR v2 (128k) | 60.1% | Pitkän kontekstin suorituskyky (8 neulaa, keskiarvo 128k) — päihittää GPT-5 minin (52.5%) ja Claude 4.5 Haikun (35.3%) |
| Tulostausnopeus | 363 tok/s | 45% nopeampi kuin Gemini 2.5 Flash (249 tok/s) — nopein hintatasollaan |
| Syöttöhinta | $0.25/1M | Per miljoona syöttötokenia — kilpailukykyinen GPT-5 minin kanssa ($0.25/1M) |
| Tulostushinta | $1.50/1M | Per miljoona tulostustokenia — huomattavasti halvempi kuin Claude 4.5 Haiku ($5.00/1M) |
Lähde: Artificial Analysis & Arena.ai Leaderboard
Tietoja Gemini 3.1 Flash Litestä
Gemini 3.1 Flash Lite on Google DeepMindin Gemini 3 -sarjan nopein ja kustannustehokkain malli, julkaistu 3. maaliskuuta 2026. Optimoitu suurivolyymisiin, viiveherkkiin tehtäviin kuten käännöksiin, luokitteluun ja yksinkertaiseen tiedonpoimintaan. 363 tokenia/s läpäisykyvyllä ja 1M tokenin konteksti-ikkunalla tarjoaa poikkeuksellisen suorituskyvyn murto-osalla kustannuksista.
Tärkeä huomio: Gemini3.us on riippumaton harrastajien yhteisö- ja kehittäjäalusta. Emme ole sidoksissa, hyväksyttyjä tai virallisesti yhteydessä Google LLC:hen. Tarjoamme maksullisen pääsyn Googlen virallisiin Gemini API -palveluihin tukeaksemme infrastruktuuriamme ja toimintaamme.
Aloita Gemini 3.1 Flash Liten käyttö
Koe Gemini 3 -sarjan nopein ja kustannustehokkain malli