gemini3.us
2026年3月3日リリース

Gemini 3.1 Flash Lite

Gemini 3シリーズ最速・最もコスト効率の高いモデル

Gemini 2.5 Flashより2.5倍高速 • 363トークン/秒 • 100万トークンコンテキスト • スケール向け設計

2.5×
初回トークン高速化
363
トークン/秒
100万
トークンコンテキスト
1/8×
Proとのコスト比

Gemini 3.1 Flash Liteの特徴

速度、コスト、大量生産ワークロードに最適化

初回トークン2.5倍高速

Gemini 3.1 Flash LiteはGemini 2.5 Flashより2.5倍速い初回トークン応答時間を実現。リアルタイムおよびインタラクティブアプリに最適。

極限のコスト効率

Gemini 3.1 Proの8分の1の価格で、大量生産デプロイに最も経済的な選択肢。

363トークン/秒

出力速度363トークン/秒を達成。Gemini 2.5 Flashの249トークン/秒より45%高速で、同等以上の品質を維持。

フルマルチモーダル入力

テキスト、画像、動画、音声、PDFの入力をサポート。100万トークンのコンテキストウィンドウ。テキストのみ出力。

動的思考レベル

タスクの複雑さに応じて計算リソースを調整する適応型思考。即時応答から深い推論まで対応。

大量エージェントタスク

大規模なエージェントパイプライン、シンプルなデータ抽出、分類、翻訳タスク向けに設計。

Gemini 3.1 Flash Liteのパフォーマンス

Gemini 3シリーズで最速・最もコスト効率が高い

速度とスループット

初回トークン時間
Gemini 2.5 Flashより2.5倍高速
2.5×
出力速度
363トークン/秒 vs 249トークン/秒
363/s
速度向上
Gemini 2.5 Flashより出力45%高速
+45%
レイテンシプロファイル
低遅延アプリケーション向けに最適化
Low

コスト効率

Gemini 3.1 Proとのコスト比
8分の1の価格
1/8×
入力価格
100万トークンあたり極めて低コスト
Low
スケール適合性
1日数百万リクエスト向け設計
M+/day
予算最適化
Gemini 3シリーズ最高のコストパフォーマンス
Best

コンテキストとマルチモーダル

コンテキストウィンドウ
1,048,576入力トークン
1M
出力トークン制限
応答あたり65,536トークン
65K
入力タイプ
テキスト、画像、動画、音声、PDF
5
バッチAPI
一括処理対応

サポートされる機能

関数呼び出し
対応
検索グラウンディング
対応
コード実行
対応
構造化出力
対応

Gemini 3.1 Flash Lite ベンチマーク結果

すべての主要ベンチマークでGemini 2.5 Flashを上回り、コストも低い

ベンチマークスコア説明
Arena Elo1432Arena.ai 人間の好みランキング — 同クラスモデルで最高性能
インテリジェンス指数34Artificial Analysis インテリジェンス指数 — Gemini 2.5 Flash-Liteより12ポイント向上
GPQA Diamond86.9%博士レベルの科学知識 — Gemini 2.5 Flash(82.8%)、Claude 4.5 Haiku(73.0%)、GPT-5 mini(82.3%)を上回る
MMMU-Pro76.8%マルチモーダル理解・推論 — Claude Opus 4.6、Kimi K2.5、GPT-5 mini(74.1%)を上回る
Video-MMMU84.8%動画からの知識習得 — GPT-5 mini(82.5%)、Grok 4.1 Fast(74.6%)を上回る
Humanity's Last Exam16.0%テキスト・マルチモーダル学術推論 — GPT-5 mini(16.7%)と同等
LiveCodeBench72.0%コード生成(2025年1月〜5月)— Gemini 2.5 Flash-Lite(34.3%)の2倍
SimpleQA Verified43.3%パラメトリック知識精度 — GPT-5 mini(9.5%)、Claude 4.5 Haiku(5.5%)の4倍
MMMLU(多言語)88.9%多言語Q&A — GPT-5 mini(84.9%)、Claude 4.5 Haiku(83.0%)、Grok 4.1 Fast(86.8%)を上回る
CharXiv Reasoning73.2%複雑なグラフからの情報統合 — Gemini 2.5 Flash(63.7%)、Claude 4.5 Haiku(61.7%)を上回る
MRCR v2(128k)60.1%長文脈性能(8針、128k平均)— GPT-5 mini(52.5%)、Claude 4.5 Haiku(35.3%)を上回る
出力速度363 tok/sGemini 2.5 Flash(249 tok/s)より45%高速 — 同価格帯で最速
入力価格$0.25/1M100万入力トークンあたり — GPT-5 mini($0.25/1M)と同等
出力価格$1.50/1M100万出力トークンあたり — Claude 4.5 Haiku($5.00/1M)より大幅に安い

出典:Artificial Analysis・Arena.ai リーダーボード

Gemini 3.1 Flash Liteについて

Gemini 3.1 Flash Liteは、Google DeepMindが2026年3月3日にリリースしたGemini 3シリーズ最速・最もコスト効率の高いモデルです。翻訳、分類、シンプルなデータ抽出などの高スループット・低遅延タスクに最適化されています。363トークン/秒のスループットと100万トークンのコンテキストウィンドウで、低コストで優れたパフォーマンスを提供します。

重要なお知らせ:Gemini3.usは独立した愛好者コミュニティおよび開発者プラットフォームです。Google LLCとの提携、承認、または公式な接続はありません。インフラと運営をサポートするため、GoogleのGemini APIサービスへの有料アクセスを提供しています。

Gemini 3.1 Flash Liteを今すぐ体験

Gemini 3シリーズ最速・最もコスト効率の高いモデルを体験