gemini3.us
2026年2月19日發布

Gemini 3.1 Pro

谷歌最強大的AI模型 — 在推理、編程和智能體能力上實現顯著提升

推理能力是Gemini 3 Pro的2倍 • 18項基準測試12項排名第一 • 原生SVG及3D程式碼渲染

查看基準測試
77.1%
ARC-AGI-2
94.3%
GPQA Diamond
80.6%
SWE-Bench
2887
LiveCodeBench Elo

Gemini 3.1 Pro 核心升級

推理、編程、多模態理解全面進化

抽象推理能力翻倍

ARC-AGI-2得分77.1%,是Gemini 3 Pro的兩倍以上,超越Claude Opus 4.6,可解決需要多步抽象推導的視覺邏輯難題。

100萬Token上下文,65K輸出

單次提示可處理完整程式庫、8.4小時音訊、900頁PDF或1小時影片。輸出擴展至65,536 Token,徹底解決截斷問題。

頂尖軟體工程能力

SWE-Bench Verified通過率80.6%,LiveCodeBench Pro Elo 2887,超越GPT-5.2,可自主處理真實軟體問題。

原生SVG及3D程式碼渲染

根據自然語言描述直接生成、動畫化並視覺化渲染SVG圖形和3D程式碼,是其他模型中較少見的能力。

長程智能體工作流

APEX-Agents 33.5%,MCP Atlas工具協調69.2%,BrowseComp自主網頁研究85.9%,在智能體基準測試中表現突出。

三檔思考模式

提供低、中、高三檔計算模式,可靈活調節輸出延遲與推理深度,從快速問答到複雜問題均游刃有餘。

Gemini 3.1 Pro 基準測試成績

在18項基準測試中12項排名第一

抽象推理

ARC-AGI-2
是Gemini 3 Pro的2倍,超越Claude Opus 4.6
77.1%
GPQA Diamond
博士級科學研究能力
94.3%
SciCode
科學問題解決
59%
APEX-Agents
自主智能體任務
33.5%

軟體工程

SWE-Bench Verified
真實軟體問題解決率
80.6%
SWE-Bench Pro
高級工程任務
54.2%
LiveCodeBench Pro Elo
第一,超越GPT-5.2和Gemini 3 Pro
2887
Terminal-Bench 2.0
檔案系統與依賴管理
68.5%

多模態理解

音訊輸入
單次最長8.4小時
8.4h
每次圖片數量
最多900張
900
影片輸入
最長1小時
1h
上下文視窗
1,048,576 Token輸入
1M

智能體能力

MCP Atlas
工具協調準確率
69.2%
BrowseComp
自主網頁研究
85.9%
綜合智能指數
Artificial Analysis評分(57.0)
57.0
編程指數
Artificial Analysis評分(55.5)
55.5

關於 Gemini 3.1 Pro

Gemini 3.1 Pro是谷歌DeepMind於2026年2月19日發布的最強AI模型。基於Transformer混合專家架構,在Gemini 3 Pro基礎上全面進化,定價不變:輸入$2/百萬Token,輸出$12/百萬Token。

重要聲明:Gemini3.us是獨立的愛好者社區和開發者平台,與Google LLC沒有任何附屬、認可或官方關聯。我們提供對谷歌官方Gemini API服務的付費訪問,以支持平台基礎設施和運營。

立即體驗 Gemini 3.1 Pro

透過我們的平台體驗 Gemini 3.1 Pro