Gemini 3.1 Flash Lite
Gemini 3シリーズ最速・最もコスト効率の高いモデル
Gemini 2.5 Flashより2.5倍高速 • 363トークン/秒 • 100万トークンコンテキスト • スケール向け設計
Gemini 3.1 Flash Liteの特徴
速度、コスト、大量生産ワークロードに最適化
初回トークン2.5倍高速
Gemini 3.1 Flash LiteはGemini 2.5 Flashより2.5倍速い初回トークン応答時間を実現。リアルタイムおよびインタラクティブアプリに最適。
極限のコスト効率
Gemini 3.1 Proの8分の1の価格で、大量生産デプロイに最も経済的な選択肢。
363トークン/秒
出力速度363トークン/秒を達成。Gemini 2.5 Flashの249トークン/秒より45%高速で、同等以上の品質を維持。
フルマルチモーダル入力
テキスト、画像、動画、音声、PDFの入力をサポート。100万トークンのコンテキストウィンドウ。テキストのみ出力。
動的思考レベル
タスクの複雑さに応じて計算リソースを調整する適応型思考。即時応答から深い推論まで対応。
大量エージェントタスク
大規模なエージェントパイプライン、シンプルなデータ抽出、分類、翻訳タスク向けに設計。
Gemini 3.1 Flash Liteのパフォーマンス
Gemini 3シリーズで最速・最もコスト効率が高い
速度とスループット
コスト効率
コンテキストとマルチモーダル
サポートされる機能
Gemini 3.1 Flash Lite ベンチマーク結果
すべての主要ベンチマークでGemini 2.5 Flashを上回り、コストも低い
| ベンチマーク | スコア | 説明 |
|---|---|---|
| Arena Elo | 1432 | Arena.ai 人間の好みランキング — 同クラスモデルで最高性能 |
| インテリジェンス指数 | 34 | Artificial Analysis インテリジェンス指数 — Gemini 2.5 Flash-Liteより12ポイント向上 |
| GPQA Diamond | 86.9% | 博士レベルの科学知識 — Gemini 2.5 Flash(82.8%)、Claude 4.5 Haiku(73.0%)、GPT-5 mini(82.3%)を上回る |
| MMMU-Pro | 76.8% | マルチモーダル理解・推論 — Claude Opus 4.6、Kimi K2.5、GPT-5 mini(74.1%)を上回る |
| Video-MMMU | 84.8% | 動画からの知識習得 — GPT-5 mini(82.5%)、Grok 4.1 Fast(74.6%)を上回る |
| Humanity's Last Exam | 16.0% | テキスト・マルチモーダル学術推論 — GPT-5 mini(16.7%)と同等 |
| LiveCodeBench | 72.0% | コード生成(2025年1月〜5月)— Gemini 2.5 Flash-Lite(34.3%)の2倍 |
| SimpleQA Verified | 43.3% | パラメトリック知識精度 — GPT-5 mini(9.5%)、Claude 4.5 Haiku(5.5%)の4倍 |
| MMMLU(多言語) | 88.9% | 多言語Q&A — GPT-5 mini(84.9%)、Claude 4.5 Haiku(83.0%)、Grok 4.1 Fast(86.8%)を上回る |
| CharXiv Reasoning | 73.2% | 複雑なグラフからの情報統合 — Gemini 2.5 Flash(63.7%)、Claude 4.5 Haiku(61.7%)を上回る |
| MRCR v2(128k) | 60.1% | 長文脈性能(8針、128k平均)— GPT-5 mini(52.5%)、Claude 4.5 Haiku(35.3%)を上回る |
| 出力速度 | 363 tok/s | Gemini 2.5 Flash(249 tok/s)より45%高速 — 同価格帯で最速 |
| 入力価格 | $0.25/1M | 100万入力トークンあたり — GPT-5 mini($0.25/1M)と同等 |
| 出力価格 | $1.50/1M | 100万出力トークンあたり — Claude 4.5 Haiku($5.00/1M)より大幅に安い |
出典:Artificial Analysis・Arena.ai リーダーボード
Gemini 3.1 Flash Liteについて
Gemini 3.1 Flash Liteは、Google DeepMindが2026年3月3日にリリースしたGemini 3シリーズ最速・最もコスト効率の高いモデルです。翻訳、分類、シンプルなデータ抽出などの高スループット・低遅延タスクに最適化されています。363トークン/秒のスループットと100万トークンのコンテキストウィンドウで、低コストで優れたパフォーマンスを提供します。
重要なお知らせ:Gemini3.usは独立した愛好者コミュニティおよび開発者プラットフォームです。Google LLCとの提携、承認、または公式な接続はありません。インフラと運営をサポートするため、GoogleのGemini APIサービスへの有料アクセスを提供しています。
Gemini 3.1 Flash Liteを今すぐ体験
Gemini 3シリーズ最速・最もコスト効率の高いモデルを体験