2026年2月19日發布
Gemini 3.1 Pro
谷歌最強大的AI模型 — 在推理、編程和智能體能力上實現顯著提升
推理能力是Gemini 3 Pro的2倍 • 18項基準測試12項排名第一 • 原生SVG及3D程式碼渲染
77.1%
ARC-AGI-2
94.3%
GPQA Diamond
80.6%
SWE-Bench
2887
LiveCodeBench Elo
Gemini 3.1 Pro 核心升級
推理、編程、多模態理解全面進化
抽象推理能力翻倍
ARC-AGI-2得分77.1%,是Gemini 3 Pro的兩倍以上,超越Claude Opus 4.6,可解決需要多步抽象推導的視覺邏輯難題。
100萬Token上下文,65K輸出
單次提示可處理完整程式庫、8.4小時音訊、900頁PDF或1小時影片。輸出擴展至65,536 Token,徹底解決截斷問題。
頂尖軟體工程能力
SWE-Bench Verified通過率80.6%,LiveCodeBench Pro Elo 2887,超越GPT-5.2,可自主處理真實軟體問題。
原生SVG及3D程式碼渲染
根據自然語言描述直接生成、動畫化並視覺化渲染SVG圖形和3D程式碼,是其他模型中較少見的能力。
長程智能體工作流
APEX-Agents 33.5%,MCP Atlas工具協調69.2%,BrowseComp自主網頁研究85.9%,在智能體基準測試中表現突出。
三檔思考模式
提供低、中、高三檔計算模式,可靈活調節輸出延遲與推理深度,從快速問答到複雜問題均游刃有餘。
Gemini 3.1 Pro 基準測試成績
在18項基準測試中12項排名第一
抽象推理
ARC-AGI-2
是Gemini 3 Pro的2倍,超越Claude Opus 4.6
77.1%
GPQA Diamond
博士級科學研究能力
94.3%
SciCode
科學問題解決
59%
APEX-Agents
自主智能體任務
33.5%
軟體工程
SWE-Bench Verified
真實軟體問題解決率
80.6%
SWE-Bench Pro
高級工程任務
54.2%
LiveCodeBench Pro Elo
第一,超越GPT-5.2和Gemini 3 Pro
2887
Terminal-Bench 2.0
檔案系統與依賴管理
68.5%
多模態理解
音訊輸入
單次最長8.4小時
8.4h
每次圖片數量
最多900張
900
影片輸入
最長1小時
1h
上下文視窗
1,048,576 Token輸入
1M
智能體能力
MCP Atlas
工具協調準確率
69.2%
BrowseComp
自主網頁研究
85.9%
綜合智能指數
Artificial Analysis評分(57.0)
57.0
編程指數
Artificial Analysis評分(55.5)
55.5
關於 Gemini 3.1 Pro
Gemini 3.1 Pro是谷歌DeepMind於2026年2月19日發布的最強AI模型。基於Transformer混合專家架構,在Gemini 3 Pro基礎上全面進化,定價不變:輸入$2/百萬Token,輸出$12/百萬Token。
重要聲明:Gemini3.us是獨立的愛好者社區和開發者平台,與Google LLC沒有任何附屬、認可或官方關聯。我們提供對谷歌官方Gemini API服務的付費訪問,以支持平台基礎設施和運營。
立即體驗 Gemini 3.1 Pro
透過我們的平台體驗 Gemini 3.1 Pro