技术规格
| 架构 | MoE 混合专家 |
| 上下文 | 1M tokens |
| 思考系统 | 三级(快速/Thinking/Deep Think) |
| API 定价 | $2.00/$12.00 per 1M |
性能表现
94.3%
GPQA Diamond
80.6%
SWE-Bench
77.1%
ARC-AGI-2
89.4%
MMLU-Pro
最佳适用场景
科研分析
GPQA 94.3% 确保高质量学术回答
复杂编程
SWE-Bench 80.6% 代码能力
深度推理
ARC-AGI-2 77.1% 通用推理
创意写作
MMLU-Pro 89.4% 知识广度
怎么选择这个模型
适合谁
适合深度推理、复杂分析、科研和高要求代码任务。
核心优势
推理能力强,适合需要质量优先而不是速度优先的场景。
何时不选
如果你更看重低延迟或大规模低成本调用,可以先看 Flash 系列。
推荐搭配
适合与教程页、API 页一起使用,先验证提示词再进入正式接入。
和其他模型怎么选
与 Gemini 3 Flash 对比
如果你更看重推理深度、复杂任务质量和高难度代码能力,3.1 Pro 通常更合适;如果更看重实时速度和成本平衡,Flash 更适合。
与 Gemini 3.1 Flash-Lite 对比
3.1 Pro 更偏高质量复杂任务,Flash-Lite 更偏轻量高频调用,两者适合承担不同层级的业务职责。
与 Gemini 2.5 Pro 对比
如果你想优先体验更新能力和更强推理,可以考虑 3.1 Pro;如果你更看重成熟稳定,2.5 Pro 仍然是可靠选择。
实际选型建议
高价值复杂任务优先 3.1 Pro,实时和低成本环节可配合 Flash 或 Flash-Lite 做分层调用。
