2026年3月3日リリース

Gemini 3.1 Flash Lite

Gemini 3シリーズ最速・最もコスト効率の高いモデル

Gemini 2.5 Flashより2.5倍高速 • 363トークン/秒 • 100万トークンコンテキスト • スケール向け設計

ベンチマークを見る

2.5×

初回トークン高速化

363

トークン/秒

100万

トークンコンテキスト

1/8×

Proとのコスト比

Gemini 3.1 Flash Liteの特徴

速度、コスト、大量生産ワークロードに最適化

初回トークン2.5倍高速

Gemini 3.1 Flash LiteはGemini 2.5 Flashより2.5倍速い初回トークン応答時間を実現。リアルタイムおよびインタラクティブアプリに最適。

極限のコスト効率

Gemini 3.1 Proの8分の1の価格で、大量生産デプロイに最も経済的な選択肢。

363トークン/秒

出力速度363トークン/秒を達成。Gemini 2.5 Flashの249トークン/秒より45%高速で、同等以上の品質を維持。

フルマルチモーダル入力

テキスト、画像、動画、音声、PDFの入力をサポート。100万トークンのコンテキストウィンドウ。テキストのみ出力。

動的思考レベル

タスクの複雑さに応じて計算リソースを調整する適応型思考。即時応答から深い推論まで対応。

大量エージェントタスク

大規模なエージェントパイプライン、シンプルなデータ抽出、分類、翻訳タスク向けに設計。

Gemini 3.1 Flash Liteのパフォーマンス

Gemini 3シリーズで最速・最もコスト効率が高い

速度とスループット

初回トークン時間

Gemini 2.5 Flashより2.5倍高速

2.5×

出力速度

363トークン/秒 vs 249トークン/秒

363/s

速度向上

Gemini 2.5 Flashより出力45%高速

+45%

レイテンシプロファイル

低遅延アプリケーション向けに最適化

Low

コスト効率

Gemini 3.1 Proとのコスト比

8分の1の価格

1/8×

入力価格

100万トークンあたり極めて低コスト

Low

スケール適合性

1日数百万リクエスト向け設計

M+/day

予算最適化

Gemini 3シリーズ最高のコストパフォーマンス

Best

コンテキストとマルチモーダル

コンテキストウィンドウ

1,048,576入力トークン

出力トークン制限

応答あたり65,536トークン

65K

入力タイプ

テキスト、画像、動画、音声、PDF

バッチAPI

一括処理対応

✓

サポートされる機能

関数呼び出し

対応

✓

検索グラウンディング

対応

✓

コード実行

対応

✓

構造化出力

対応

✓

Gemini 3.1 Flash Lite ベンチマーク結果

すべての主要ベンチマークでGemini 2.5 Flashを上回り、コストも低い

ベンチマーク	スコア	説明
Arena Elo	1432	Arena.ai 人間の好みランキング — 同クラスモデルで最高性能
インテリジェンス指数	34	Artificial Analysis インテリジェンス指数 — Gemini 2.5 Flash-Liteより12ポイント向上
GPQA Diamond	86.9%	博士レベルの科学知識 — Gemini 2.5 Flash（82.8%）、Claude 4.5 Haiku（73.0%）、GPT-5 mini（82.3%）を上回る
MMMU-Pro	76.8%	マルチモーダル理解・推論 — Claude Opus 4.6、Kimi K2.5、GPT-5 mini（74.1%）を上回る
Video-MMMU	84.8%	動画からの知識習得 — GPT-5 mini（82.5%）、Grok 4.1 Fast（74.6%）を上回る
Humanity's Last Exam	16.0%	テキスト・マルチモーダル学術推論 — GPT-5 mini（16.7%）と同等
LiveCodeBench	72.0%	コード生成（2025年1月〜5月）— Gemini 2.5 Flash-Lite（34.3%）の2倍
SimpleQA Verified	43.3%	パラメトリック知識精度 — GPT-5 mini（9.5%）、Claude 4.5 Haiku（5.5%）の4倍
MMMLU（多言語）	88.9%	多言語Q&A — GPT-5 mini（84.9%）、Claude 4.5 Haiku（83.0%）、Grok 4.1 Fast（86.8%）を上回る
CharXiv Reasoning	73.2%	複雑なグラフからの情報統合 — Gemini 2.5 Flash（63.7%）、Claude 4.5 Haiku（61.7%）を上回る
MRCR v2（128k）	60.1%	長文脈性能（8針、128k平均）— GPT-5 mini（52.5%）、Claude 4.5 Haiku（35.3%）を上回る
出力速度	363 tok/s	Gemini 2.5 Flash（249 tok/s）より45%高速 — 同価格帯で最速
入力価格	$0.25/1M	100万入力トークンあたり — GPT-5 mini（$0.25/1M）と同等
出力価格	$1.50/1M	100万出力トークンあたり — Claude 4.5 Haiku（$5.00/1M）より大幅に安い

出典：Artificial Analysis・Arena.ai リーダーボード

Gemini 3.1 Flash Liteについて

Gemini 3.1 Flash Liteは、Google DeepMindが2026年3月3日にリリースしたGemini 3シリーズ最速・最もコスト効率の高いモデルです。翻訳、分類、シンプルなデータ抽出などの高スループット・低遅延タスクに最適化されています。363トークン/秒のスループットと100万トークンのコンテキストウィンドウで、低コストで優れたパフォーマンスを提供します。

重要なお知らせ：Gemini3.usは独立した愛好者コミュニティおよび開発者プラットフォームです。Google LLCとの提携、承認、または公式な接続はありません。インフラと運営をサポートするため、GoogleのGemini APIサービスへの有料アクセスを提供しています。

Gemini 3.1 Flash Liteを今すぐ体験

Gemini 3シリーズ最速・最もコスト効率の高いモデルを体験