2026年2月19日發布

Gemini 3.1 Pro

谷歌最強大的AI模型 — 在推理、編程和智能體能力上實現顯著提升

推理能力是Gemini 3 Pro的2倍 • 18項基準測試12項排名第一 • 原生SVG及3D程式碼渲染

查看基準測試

77.1%

ARC-AGI-2

94.3%

GPQA Diamond

80.6%

SWE-Bench

2887

LiveCodeBench Elo

Gemini 3.1 Pro 核心升級

推理、編程、多模態理解全面進化

抽象推理能力翻倍

ARC-AGI-2得分77.1%，是Gemini 3 Pro的兩倍以上，超越Claude Opus 4.6，可解決需要多步抽象推導的視覺邏輯難題。

100萬Token上下文，65K輸出

單次提示可處理完整程式庫、8.4小時音訊、900頁PDF或1小時影片。輸出擴展至65,536 Token，徹底解決截斷問題。

頂尖軟體工程能力

SWE-Bench Verified通過率80.6%，LiveCodeBench Pro Elo 2887，超越GPT-5.2，可自主處理真實軟體問題。

原生SVG及3D程式碼渲染

根據自然語言描述直接生成、動畫化並視覺化渲染SVG圖形和3D程式碼，是其他模型中較少見的能力。

長程智能體工作流

APEX-Agents 33.5%，MCP Atlas工具協調69.2%，BrowseComp自主網頁研究85.9%，在智能體基準測試中表現突出。

三檔思考模式

提供低、中、高三檔計算模式，可靈活調節輸出延遲與推理深度，從快速問答到複雜問題均游刃有餘。

Gemini 3.1 Pro 基準測試成績

在18項基準測試中12項排名第一

抽象推理

ARC-AGI-2

是Gemini 3 Pro的2倍，超越Claude Opus 4.6

77.1%

GPQA Diamond

博士級科學研究能力

94.3%

SciCode

科學問題解決

59%

APEX-Agents

自主智能體任務

33.5%

軟體工程

SWE-Bench Verified

真實軟體問題解決率

80.6%

SWE-Bench Pro

高級工程任務

54.2%

LiveCodeBench Pro Elo

第一，超越GPT-5.2和Gemini 3 Pro

2887

Terminal-Bench 2.0

檔案系統與依賴管理

68.5%

多模態理解

音訊輸入

單次最長8.4小時

8.4h

每次圖片數量

最多900張

900

影片輸入

最長1小時

上下文視窗

1,048,576 Token輸入

智能體能力

MCP Atlas

工具協調準確率

69.2%

BrowseComp

自主網頁研究

85.9%

綜合智能指數

Artificial Analysis評分（57.0）

57.0

編程指數

Artificial Analysis評分（55.5）

55.5

關於 Gemini 3.1 Pro

Gemini 3.1 Pro是谷歌DeepMind於2026年2月19日發布的最強AI模型。基於Transformer混合專家架構，在Gemini 3 Pro基礎上全面進化，定價不變：輸入$2/百萬Token，輸出$12/百萬Token。

重要聲明：Gemini3.us是獨立的愛好者社區和開發者平台，與Google LLC沒有任何附屬、認可或官方關聯。我們提供對谷歌官方Gemini API服務的付費訪問，以支持平台基礎設施和運營。

立即體驗 Gemini 3.1 Pro

透過我們的平台體驗 Gemini 3.1 Pro