gemini3.us
2026年2月19日发布

Gemini 3.1 Pro

谷歌最强大的AI模型 — 在推理、编程和智能体能力上实现显著提升

推理能力是Gemini 3 Pro的2倍 • 在18项基准测试中12项排名第一 • 原生SVG及3D代码渲染

查看基准测试
77.1%
ARC-AGI-2得分
94.3%
GPQA Diamond
80.6%
SWE-Bench验证
2887
LiveCodeBench Elo

Gemini 3.1 Pro 核心升级

推理、编程、多模态理解全面进化

抽象推理能力翻倍

ARC-AGI-2得分77.1%,是Gemini 3 Pro的两倍以上,超越Claude Opus 4.6,可解决需要多步抽象推导的视觉逻辑难题。

100万Token上下文,65K输出

单次提示可处理完整代码库、8.4小时音频、900页PDF或1小时视频。输出扩展至65,536 Token,彻底告别截断问题。

顶尖软件工程能力

SWE-Bench Verified通过率80.6%,LiveCodeBench Pro Elo得分2887,超越GPT-5.2,可自主处理真实软件问题。

原生SVG及3D代码渲染

根据自然语言描述直接生成、动画化并可视化渲染SVG图形和3D代码,是其他模型中较少见的能力。

长程智能体工作流

APEX-Agents得分33.5%,MCP Atlas工具协调69.2%,BrowseComp自主网页研究85.9%,在智能体基准测试中表现突出。

三档思考模式

提供低、中、高三档计算模式,可灵活调节输出延迟与推理深度,从快速问答到复杂问题解决均游刃有余。

Gemini 3.1 Pro 基准测试成绩

在推理、编程、多模态、智能体18项基准中12项排名第一

抽象推理

ARC-AGI-2
是Gemini 3 Pro的2倍,超越Claude Opus 4.6
77.1%
GPQA Diamond
博士级科学与研究能力
94.3%
SciCode
科学问题解决能力
59%
APEX-Agents
自主智能体任务
33.5%

软件工程

SWE-Bench Verified
真实软件问题解决率
80.6%
SWE-Bench Pro
高级工程任务
54.2%
LiveCodeBench Pro Elo
第一名,超越GPT-5.2和Gemini 3 Pro
2887
Terminal-Bench 2.0
文件系统与依赖管理
68.5%

多模态理解

音频输入
单次最长8.4小时
8.4h
每次图片数量
最多900张
900
视频输入
最长1小时视频
1h
上下文窗口
1,048,576 Token输入
1M

智能体能力

MCP Atlas
工具协调准确率
69.2%
BrowseComp
自主网页研究
85.9%
综合智能指数
Artificial Analysis评分(57.0)
57.0
编程指数
Artificial Analysis评分(55.5)
55.5

关于 Gemini 3.1 Pro

Gemini 3.1 Pro是谷歌DeepMind于2026年2月19日发布的最强AI模型。基于Transformer混合专家架构,在Gemini 3 Pro基础上全面进化,每项指标均有显著提升,且定价不变:输入$2/百万Token,输出$12/百万Token。

重要声明:Gemini3.us是独立的爱好者社区和开发者平台,与Google LLC没有任何附属、认可或官方关联。我们提供对谷歌官方Gemini API服务的付费访问,以支持平台基础设施和运营。

立即体验 Gemini 3.1 Pro

通过我们的平台体验 Gemini 3.1 Pro