gemini3.us
2026年2月19日发布

Gemini 3.1 Pro

谷歌最强大的AI模型 — 在推理、编程和智能体能力上实现显著提升

推理能力是Gemini 3 Pro的2倍 • 在18项基准测试中12项排名第一 • 原生SVG及3D代码渲染

查看基准测试
77.1%
ARC-AGI-2得分
94.3%
GPQA Diamond
80.6%
SWE-Bench验证
2887
LiveCodeBench Elo

Gemini 3.1 Pro 核心升级

推理、编程、多模态理解全面进化

抽象推理能力翻倍

ARC-AGI-2得分77.1%,是Gemini 3 Pro的两倍以上,超越Claude Opus 4.6,可解决需要多步抽象推导的视觉逻辑难题。

100万Token上下文,65K输出

单次提示可处理完整代码库、8.4小时音频、900页PDF或1小时视频。输出扩展至65,536 Token,彻底告别截断问题。

顶尖软件工程能力

SWE-Bench Verified通过率80.6%,LiveCodeBench Pro Elo得分2887,超越GPT-5.2,可自主处理真实软件问题。

原生SVG及3D代码渲染

根据自然语言描述直接生成、动画化并可视化渲染SVG图形和3D代码,是其他模型中较少见的能力。

长程智能体工作流

APEX-Agents得分33.5%,MCP Atlas工具协调69.2%,BrowseComp自主网页研究85.9%,在智能体基准测试中表现突出。

三档思考模式

提供低、中、高三档计算模式,可灵活调节输出延迟与推理深度,从快速问答到复杂问题解决均游刃有余。

Gemini 3.1 Pro 基准测试成绩

在推理、编程、多模态、智能体18项基准中12项排名第一

抽象推理

ARC-AGI-2
是Gemini 3 Pro的2倍,超越Claude Opus 4.6
77.1%
GPQA Diamond
博士级科学与研究能力
94.3%
SciCode
科学问题解决能力
59%
APEX-Agents
自主智能体任务
33.5%

软件工程

SWE-Bench Verified
真实软件问题解决率
80.6%
SWE-Bench Pro
高级工程任务
54.2%
LiveCodeBench Pro Elo
第一名,超越GPT-5.2和Gemini 3 Pro
2887
Terminal-Bench 2.0
文件系统与依赖管理
68.5%

多模态理解

音频输入
单次最长8.4小时
8.4h
每次图片数量
最多900张
900
视频输入
最长1小时视频
1h
上下文窗口
1,048,576 Token输入
1M

智能体能力

MCP Atlas
工具协调准确率
69.2%
BrowseComp
自主网页研究
85.9%
综合智能指数
Artificial Analysis评分(57.0)
57.0
编程指数
Artificial Analysis评分(55.5)
55.5
Benchmark Comparison

Gemini 3.1 Pro 对比竞品

Gemini 3.1 Pro 与 Claude Opus 4.6、GPT-5.2、GPT-5.4 在关键基准测试和定价上的对比

推理与知识

基准测试Gemini 3.1 ProClaude Opus 4.6GPT-5.2GPT-5.4
ARC-AGI-277.1%68.8%52.9%73.3%
GPQA Diamond94.3%91.3%92.4%92.8%
OSWorld(电脑操控)72.7%47.3%75.0%
GDPval(知识工作)78.0%70.9%83.0%

编程与智能体任务

基准测试Gemini 3.1 ProClaude Opus 4.6GPT-5.2GPT-5.4
SWE-Bench Verified80.6%80.8%80.0%
SWE-Bench Pro54.2%55.6%57.7%
LiveCodeBench Pro Elo28872393
Terminal-Bench 2.068.5%65.4%54.0%75.1%
MCP Atlas69.2%59.5%60.6%67.2%

定价

基准测试Gemini 3.1 ProClaude Opus 4.6GPT-5.2GPT-5.4
输入价格 / 百万Token$2.00$15.00$1.75$2.50
输出价格 / 百万Token$12.00$75.00$14.00$15.00

Gemini 3.1 Pro 常见问题

关于 Gemini 3.1 Pro 的常见问题解答

什么是 Gemini 3.1 Pro?
Gemini 3.1 Pro 是谷歌 DeepMind 于 2026 年 2 月 19 日发布的最强 AI 模型。推理能力较 Gemini 3 Pro 提升 2 倍以上,在 18 项基准测试中 12 项排名第一,支持 100 万 Token 上下文和 65K Token 输出,基于 Transformer 混合专家架构构建。
Gemini 3.1 Pro 是什么时候发布的?
Gemini 3.1 Pro 于 2026 年 2 月 19 日发布。这是 Gemini 主要版本之间首次使用 '.1' 增量命名——谷歌此前使用 '.5' 作为中期更新标识。命名变化反映了推理和智能体性能的显著跃升。
Gemini 3.1 Pro 的价格是多少?
Gemini 3.1 Pro 输入价格为每百万 Token $2,输出价格为每百万 Token $12,与 Gemini 3 Pro 定价相同。超过 20 万 Token 的提示,价格调整为 $4/$18。上下文缓存可降低最多 75% 的成本。输入价格比 Claude Opus 4.6 便宜 7.5 倍。
Gemini 3.1 Pro 与 GPT-5.4 相比如何?
Gemini 3.1 Pro 在 ARC-AGI-2(77.1% vs 73.3%)、GPQA Diamond(94.3% vs 92.8%)和 MCP Atlas 工具协调(69.2%)上领先。GPT-5.4 在 Terminal-Bench 2.0(75.1% vs 68.5%)、SWE-Bench Pro(57.7% vs 54.2%)、OSWorld 电脑操控(75.0%)和知识工作(83.0% GDPval)上领先。Gemini 3.1 Pro 定价更低,$2/$12 vs $2.50/$15(每百万 Token)。
Gemini 3.1 Pro 与 Claude Opus 4.6 相比如何?
Gemini 3.1 Pro 在 ARC-AGI-2(77.1% vs 68.8%)、GPQA Diamond(94.3% vs 91.3%)、LiveCodeBench Pro(2887 Elo)和 MCP Atlas(69.2% vs 59.5%)上领先。Claude Opus 4.6 在 SWE-Bench Verified(80.8% vs 80.6%)上略微领先。Gemini 3.1 Pro 输入价格便宜 7.5 倍($2 vs $15 每百万 Token)。
Gemini 3.1 Pro 的上下文窗口有多大?
Gemini 3.1 Pro 支持 1,048,576 Token(100 万)的输入上下文窗口,最多输出 65,536 Token。单次提示可处理完整代码库、8.4 小时音频、900 页 PDF 或 1 小时视频。
Gemini 3.1 Pro 能生成 SVG 和 3D 代码吗?
可以。Gemini 3.1 Pro 能根据自然语言描述直接生成、动画化并可视化渲染 SVG 图形和 3D 代码。这种原生 SVG 和 3D 渲染能力在其他前沿模型中并不常见。
Gemini 3.1 Pro 的思考档位有哪些?
Gemini 3.1 Pro 提供三档思考模式:低档(最快,适合简单查询和分类)、中档(均衡,适合代码审查和数据分析)和高档(最深推理,适合复杂编程和研究)。中档是 3.1 Pro 新增的,有助于为不需要完整推理的任务优化成本。

关于 Gemini 3.1 Pro

Gemini 3.1 Pro是谷歌DeepMind于2026年2月19日发布的最强AI模型。基于Transformer混合专家架构,在Gemini 3 Pro基础上全面进化,每项指标均有显著提升,且定价不变:输入$2/百万Token,输出$12/百万Token。

重要声明:Gemini3.us是独立的爱好者社区和开发者平台,与Google LLC没有任何附属、认可或官方关联。我们提供对谷歌官方Gemini API服务的付费访问,以支持平台基础设施和运营。

立即体验 Gemini 3.1 Pro

通过我们的平台体验 Gemini 3.1 Pro