2026年2月19日发布

Gemini 3.1 Pro

谷歌最强大的AI模型 — 在推理、编程和智能体能力上实现显著提升

推理能力是Gemini 3 Pro的2倍 • 在18项基准测试中12项排名第一 • 原生SVG及3D代码渲染

查看基准测试

77.1%

ARC-AGI-2得分

94.3%

GPQA Diamond

80.6%

SWE-Bench验证

2887

LiveCodeBench Elo

Gemini 3.1 Pro 核心升级

推理、编程、多模态理解全面进化

抽象推理能力翻倍

ARC-AGI-2得分77.1%，是Gemini 3 Pro的两倍以上，超越Claude Opus 4.6，可解决需要多步抽象推导的视觉逻辑难题。

100万Token上下文，65K输出

单次提示可处理完整代码库、8.4小时音频、900页PDF或1小时视频。输出扩展至65,536 Token，彻底告别截断问题。

顶尖软件工程能力

SWE-Bench Verified通过率80.6%，LiveCodeBench Pro Elo得分2887，超越GPT-5.2，可自主处理真实软件问题。

原生SVG及3D代码渲染

根据自然语言描述直接生成、动画化并可视化渲染SVG图形和3D代码，是其他模型中较少见的能力。

长程智能体工作流

APEX-Agents得分33.5%，MCP Atlas工具协调69.2%，BrowseComp自主网页研究85.9%，在智能体基准测试中表现突出。

三档思考模式

提供低、中、高三档计算模式，可灵活调节输出延迟与推理深度，从快速问答到复杂问题解决均游刃有余。

Gemini 3.1 Pro 基准测试成绩

在推理、编程、多模态、智能体18项基准中12项排名第一

抽象推理

ARC-AGI-2

是Gemini 3 Pro的2倍，超越Claude Opus 4.6

77.1%

GPQA Diamond

博士级科学与研究能力

94.3%

SciCode

科学问题解决能力

59%

APEX-Agents

自主智能体任务

33.5%

软件工程

SWE-Bench Verified

真实软件问题解决率

80.6%

SWE-Bench Pro

高级工程任务

54.2%

LiveCodeBench Pro Elo

第一名，超越GPT-5.2和Gemini 3 Pro

2887

Terminal-Bench 2.0

文件系统与依赖管理

68.5%

多模态理解

音频输入

单次最长8.4小时

8.4h

每次图片数量

最多900张

900

视频输入

最长1小时视频

上下文窗口

1,048,576 Token输入

智能体能力

MCP Atlas

工具协调准确率

69.2%

BrowseComp

自主网页研究

85.9%

综合智能指数

Artificial Analysis评分（57.0）

57.0

编程指数

Artificial Analysis评分（55.5）

55.5

关于 Gemini 3.1 Pro

Gemini 3.1 Pro是谷歌DeepMind于2026年2月19日发布的最强AI模型。基于Transformer混合专家架构，在Gemini 3 Pro基础上全面进化，每项指标均有显著提升，且定价不变：输入$2/百万Token，输出$12/百万Token。

重要声明：Gemini3.us是独立的爱好者社区和开发者平台，与Google LLC没有任何附属、认可或官方关联。我们提供对谷歌官方Gemini API服务的付费访问，以支持平台基础设施和运营。

立即体验 Gemini 3.1 Pro

通过我们的平台体验 Gemini 3.1 Pro