Gemini 3.1 Pro
谷歌最强大的AI模型 — 在推理、编程和智能体能力上实现显著提升
推理能力是Gemini 3 Pro的2倍 • 在18项基准测试中12项排名第一 • 原生SVG及3D代码渲染
Gemini 3.1 Pro 核心升级
推理、编程、多模态理解全面进化
抽象推理能力翻倍
ARC-AGI-2得分77.1%,是Gemini 3 Pro的两倍以上,超越Claude Opus 4.6,可解决需要多步抽象推导的视觉逻辑难题。
100万Token上下文,65K输出
单次提示可处理完整代码库、8.4小时音频、900页PDF或1小时视频。输出扩展至65,536 Token,彻底告别截断问题。
顶尖软件工程能力
SWE-Bench Verified通过率80.6%,LiveCodeBench Pro Elo得分2887,超越GPT-5.2,可自主处理真实软件问题。
原生SVG及3D代码渲染
根据自然语言描述直接生成、动画化并可视化渲染SVG图形和3D代码,是其他模型中较少见的能力。
长程智能体工作流
APEX-Agents得分33.5%,MCP Atlas工具协调69.2%,BrowseComp自主网页研究85.9%,在智能体基准测试中表现突出。
三档思考模式
提供低、中、高三档计算模式,可灵活调节输出延迟与推理深度,从快速问答到复杂问题解决均游刃有余。
Gemini 3.1 Pro 基准测试成绩
在推理、编程、多模态、智能体18项基准中12项排名第一
抽象推理
软件工程
多模态理解
智能体能力
Gemini 3.1 Pro 对比竞品
Gemini 3.1 Pro 与 Claude Opus 4.6、GPT-5.2、GPT-5.4 在关键基准测试和定价上的对比
推理与知识
| 基准测试 | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2 | GPT-5.4 |
|---|---|---|---|---|
| ARC-AGI-2 | 77.1% | 68.8% | 52.9% | 73.3% |
| GPQA Diamond | 94.3% | 91.3% | 92.4% | 92.8% |
| OSWorld(电脑操控) | — | 72.7% | 47.3% | 75.0% |
| GDPval(知识工作) | — | 78.0% | 70.9% | 83.0% |
编程与智能体任务
| 基准测试 | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2 | GPT-5.4 |
|---|---|---|---|---|
| SWE-Bench Verified | 80.6% | 80.8% | 80.0% | — |
| SWE-Bench Pro | 54.2% | — | 55.6% | 57.7% |
| LiveCodeBench Pro Elo | 2887 | — | 2393 | — |
| Terminal-Bench 2.0 | 68.5% | 65.4% | 54.0% | 75.1% |
| MCP Atlas | 69.2% | 59.5% | 60.6% | 67.2% |
定价
| 基准测试 | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2 | GPT-5.4 |
|---|---|---|---|---|
| 输入价格 / 百万Token | $2.00 | $15.00 | $1.75 | $2.50 |
| 输出价格 / 百万Token | $12.00 | $75.00 | $14.00 | $15.00 |
Gemini 3.1 Pro 常见问题
关于 Gemini 3.1 Pro 的常见问题解答
- 什么是 Gemini 3.1 Pro?
- Gemini 3.1 Pro 是谷歌 DeepMind 于 2026 年 2 月 19 日发布的最强 AI 模型。推理能力较 Gemini 3 Pro 提升 2 倍以上,在 18 项基准测试中 12 项排名第一,支持 100 万 Token 上下文和 65K Token 输出,基于 Transformer 混合专家架构构建。
- Gemini 3.1 Pro 是什么时候发布的?
- Gemini 3.1 Pro 于 2026 年 2 月 19 日发布。这是 Gemini 主要版本之间首次使用 '.1' 增量命名——谷歌此前使用 '.5' 作为中期更新标识。命名变化反映了推理和智能体性能的显著跃升。
- Gemini 3.1 Pro 的价格是多少?
- Gemini 3.1 Pro 输入价格为每百万 Token $2,输出价格为每百万 Token $12,与 Gemini 3 Pro 定价相同。超过 20 万 Token 的提示,价格调整为 $4/$18。上下文缓存可降低最多 75% 的成本。输入价格比 Claude Opus 4.6 便宜 7.5 倍。
- Gemini 3.1 Pro 与 GPT-5.4 相比如何?
- Gemini 3.1 Pro 在 ARC-AGI-2(77.1% vs 73.3%)、GPQA Diamond(94.3% vs 92.8%)和 MCP Atlas 工具协调(69.2%)上领先。GPT-5.4 在 Terminal-Bench 2.0(75.1% vs 68.5%)、SWE-Bench Pro(57.7% vs 54.2%)、OSWorld 电脑操控(75.0%)和知识工作(83.0% GDPval)上领先。Gemini 3.1 Pro 定价更低,$2/$12 vs $2.50/$15(每百万 Token)。
- Gemini 3.1 Pro 与 Claude Opus 4.6 相比如何?
- Gemini 3.1 Pro 在 ARC-AGI-2(77.1% vs 68.8%)、GPQA Diamond(94.3% vs 91.3%)、LiveCodeBench Pro(2887 Elo)和 MCP Atlas(69.2% vs 59.5%)上领先。Claude Opus 4.6 在 SWE-Bench Verified(80.8% vs 80.6%)上略微领先。Gemini 3.1 Pro 输入价格便宜 7.5 倍($2 vs $15 每百万 Token)。
- Gemini 3.1 Pro 的上下文窗口有多大?
- Gemini 3.1 Pro 支持 1,048,576 Token(100 万)的输入上下文窗口,最多输出 65,536 Token。单次提示可处理完整代码库、8.4 小时音频、900 页 PDF 或 1 小时视频。
- Gemini 3.1 Pro 能生成 SVG 和 3D 代码吗?
- 可以。Gemini 3.1 Pro 能根据自然语言描述直接生成、动画化并可视化渲染 SVG 图形和 3D 代码。这种原生 SVG 和 3D 渲染能力在其他前沿模型中并不常见。
- Gemini 3.1 Pro 的思考档位有哪些?
- Gemini 3.1 Pro 提供三档思考模式:低档(最快,适合简单查询和分类)、中档(均衡,适合代码审查和数据分析)和高档(最深推理,适合复杂编程和研究)。中档是 3.1 Pro 新增的,有助于为不需要完整推理的任务优化成本。
关于 Gemini 3.1 Pro
Gemini 3.1 Pro是谷歌DeepMind于2026年2月19日发布的最强AI模型。基于Transformer混合专家架构,在Gemini 3 Pro基础上全面进化,每项指标均有显著提升,且定价不变:输入$2/百万Token,输出$12/百万Token。
重要声明:Gemini3.us是独立的爱好者社区和开发者平台,与Google LLC没有任何附属、认可或官方关联。我们提供对谷歌官方Gemini API服务的付费访问,以支持平台基础设施和运营。
立即体验 Gemini 3.1 Pro
通过我们的平台体验 Gemini 3.1 Pro