gemini3.us
2026年2月19日發布

Gemini 3.1 Pro

谷歌最強大的AI模型 — 在推理、編程和智能體能力上實現顯著提升

推理能力是Gemini 3 Pro的2倍 • 18項基準測試12項排名第一 • 原生SVG及3D程式碼渲染

查看基準測試
77.1%
ARC-AGI-2
94.3%
GPQA Diamond
80.6%
SWE-Bench
2887
LiveCodeBench Elo

Gemini 3.1 Pro 核心升級

推理、編程、多模態理解全面進化

抽象推理能力翻倍

ARC-AGI-2得分77.1%,是Gemini 3 Pro的兩倍以上,超越Claude Opus 4.6,可解決需要多步抽象推導的視覺邏輯難題。

100萬Token上下文,65K輸出

單次提示可處理完整程式庫、8.4小時音訊、900頁PDF或1小時影片。輸出擴展至65,536 Token,徹底解決截斷問題。

頂尖軟體工程能力

SWE-Bench Verified通過率80.6%,LiveCodeBench Pro Elo 2887,超越GPT-5.2,可自主處理真實軟體問題。

原生SVG及3D程式碼渲染

根據自然語言描述直接生成、動畫化並視覺化渲染SVG圖形和3D程式碼,是其他模型中較少見的能力。

長程智能體工作流

APEX-Agents 33.5%,MCP Atlas工具協調69.2%,BrowseComp自主網頁研究85.9%,在智能體基準測試中表現突出。

三檔思考模式

提供低、中、高三檔計算模式,可靈活調節輸出延遲與推理深度,從快速問答到複雜問題均游刃有餘。

Gemini 3.1 Pro 基準測試成績

在18項基準測試中12項排名第一

抽象推理

ARC-AGI-2
是Gemini 3 Pro的2倍,超越Claude Opus 4.6
77.1%
GPQA Diamond
博士級科學研究能力
94.3%
SciCode
科學問題解決
59%
APEX-Agents
自主智能體任務
33.5%

軟體工程

SWE-Bench Verified
真實軟體問題解決率
80.6%
SWE-Bench Pro
高級工程任務
54.2%
LiveCodeBench Pro Elo
第一,超越GPT-5.2和Gemini 3 Pro
2887
Terminal-Bench 2.0
檔案系統與依賴管理
68.5%

多模態理解

音訊輸入
單次最長8.4小時
8.4h
每次圖片數量
最多900張
900
影片輸入
最長1小時
1h
上下文視窗
1,048,576 Token輸入
1M

智能體能力

MCP Atlas
工具協調準確率
69.2%
BrowseComp
自主網頁研究
85.9%
綜合智能指數
Artificial Analysis評分(57.0)
57.0
編程指數
Artificial Analysis評分(55.5)
55.5
Benchmark Comparison

Gemini 3.1 Pro 對比競品

Gemini 3.1 Pro 與 Claude Opus 4.6、GPT-5.2、GPT-5.4 在關鍵基準測試和定價上的對比

推理與知識

基準測試Gemini 3.1 ProClaude Opus 4.6GPT-5.2GPT-5.4
ARC-AGI-277.1%68.8%52.9%73.3%
GPQA Diamond94.3%91.3%92.4%92.8%
OSWorld(電腦操控)72.7%47.3%75.0%
GDPval(知識工作)78.0%70.9%83.0%

編程與智能體任務

基準測試Gemini 3.1 ProClaude Opus 4.6GPT-5.2GPT-5.4
SWE-Bench Verified80.6%80.8%80.0%
SWE-Bench Pro54.2%55.6%57.7%
LiveCodeBench Pro Elo28872393
Terminal-Bench 2.068.5%65.4%54.0%75.1%
MCP Atlas69.2%59.5%60.6%67.2%

定價

基準測試Gemini 3.1 ProClaude Opus 4.6GPT-5.2GPT-5.4
輸入價格 / 百萬Token$2.00$15.00$1.75$2.50
輸出價格 / 百萬Token$12.00$75.00$14.00$15.00

Gemini 3.1 Pro 常見問題

關於 Gemini 3.1 Pro 的常見問題解答

什麼是 Gemini 3.1 Pro?
Gemini 3.1 Pro 是谷歌 DeepMind 於 2026 年 2 月 19 日發布的最強 AI 模型。推理能力較 Gemini 3 Pro 提升 2 倍以上,在 18 項基準測試中 12 項排名第一,支援 100 萬 Token 上下文和 65K Token 輸出,基於 Transformer 混合專家架構構建。
Gemini 3.1 Pro 是什麼時候發布的?
Gemini 3.1 Pro 於 2026 年 2 月 19 日發布。這是 Gemini 主要版本之間首次使用 '.1' 增量命名——谷歌此前使用 '.5' 作為中期更新標識。命名變化反映了推理和智能體性能的顯著躍升。
Gemini 3.1 Pro 的價格是多少?
Gemini 3.1 Pro 輸入價格為每百萬 Token $2,輸出價格為每百萬 Token $12,與 Gemini 3 Pro 定價相同。超過 20 萬 Token 的提示,價格調整為 $4/$18。上下文快取可降低最多 75% 的成本。輸入價格比 Claude Opus 4.6 便宜 7.5 倍。
Gemini 3.1 Pro 與 GPT-5.4 相比如何?
Gemini 3.1 Pro 在 ARC-AGI-2(77.1% vs 73.3%)、GPQA Diamond(94.3% vs 92.8%)和 MCP Atlas 工具協調(69.2%)上領先。GPT-5.4 在 Terminal-Bench 2.0(75.1% vs 68.5%)、SWE-Bench Pro(57.7% vs 54.2%)、OSWorld 電腦操控(75.0%)和知識工作(83.0% GDPval)上領先。Gemini 3.1 Pro 定價更低,$2/$12 vs $2.50/$15(每百萬 Token)。
Gemini 3.1 Pro 與 Claude Opus 4.6 相比如何?
Gemini 3.1 Pro 在 ARC-AGI-2(77.1% vs 68.8%)、GPQA Diamond(94.3% vs 91.3%)、LiveCodeBench Pro(2887 Elo)和 MCP Atlas(69.2% vs 59.5%)上領先。Claude Opus 4.6 在 SWE-Bench Verified(80.8% vs 80.6%)上略微領先。Gemini 3.1 Pro 輸入價格便宜 7.5 倍($2 vs $15 每百萬 Token)。
Gemini 3.1 Pro 的上下文視窗有多大?
Gemini 3.1 Pro 支援 1,048,576 Token(100 萬)的輸入上下文視窗,最多輸出 65,536 Token。單次提示可處理完整程式庫、8.4 小時音訊、900 頁 PDF 或 1 小時影片。
Gemini 3.1 Pro 能生成 SVG 和 3D 程式碼嗎?
可以。Gemini 3.1 Pro 能根據自然語言描述直接生成、動畫化並視覺化渲染 SVG 圖形和 3D 程式碼。這種原生 SVG 和 3D 渲染能力在其他前沿模型中並不常見。
Gemini 3.1 Pro 的思考檔位有哪些?
Gemini 3.1 Pro 提供三檔思考模式:低檔(最快,適合簡單查詢和分類)、中檔(均衡,適合程式碼審查和資料分析)和高檔(最深推理,適合複雜編程和研究)。中檔是 3.1 Pro 新增的,有助於為不需要完整推理的任務優化成本。

關於 Gemini 3.1 Pro

Gemini 3.1 Pro是谷歌DeepMind於2026年2月19日發布的最強AI模型。基於Transformer混合專家架構,在Gemini 3 Pro基礎上全面進化,定價不變:輸入$2/百萬Token,輸出$12/百萬Token。

重要聲明:Gemini3.us是獨立的愛好者社區和開發者平台,與Google LLC沒有任何附屬、認可或官方關聯。我們提供對谷歌官方Gemini API服務的付費訪問,以支持平台基礎設施和運營。

立即體驗 Gemini 3.1 Pro

透過我們的平台體驗 Gemini 3.1 Pro