春节档大模型再开战，谷歌 Gemini 3.1Pro跑分超Claude，成本还更低

2026-02-21

蓝鲸新闻2月21日讯(记者武静静)就在开发者社区还在讨论各家春节期间的更新时，谷歌深夜放出了新一代模型底座——Gemini 3.1 Pro。谷歌表示，从去年11月至今，用户真实的反馈，都加速了每一次的研发迭代。

相比去年11月发布的 Gemini 3 Pro ，这次版本号只增加了“0.1”，但从官方披露的测试结果来看，3.1Pro在多模态生成和深度推理上跃升了一大步。

最直观的变化来自推理能力的跃升。在ARC-AGI-2测试中，Gemini 3.1 Pro得分达到77.1%，而Gemini 3 Pro为31.1%，性能直接翻倍以上。在衡量跨学科复杂问题能力的 Humanity’s Last Exam 中，Gemini 3.1 Pro得分44.4% ，不仅高于前代的37.5%，也超过了GPT-5.2的34.5%。

春节档大模型再开战，谷歌 Gemini 3.1Pro跑分超Claude ，成本还更低

在综合人工智能分析指数中，Gemini 3.1 Pro预览版同样位居榜首，领先Claude Opus 4.6约4分，同时运行成本却不到后者的一半。对于企业和开发者而言，这种“性能提升+成本不升 ”的组合，往往比单纯的榜单排名更具吸引力。

春节档大模型再开战，谷歌 Gemini 3.1Pro跑分超Claude ，成本还更低

开发者的反馈也集中在这一点上。有开发者评论称，当Gemini 3在去年11月发布时，其能力覆盖率就已达到约37.5%，相较此前模型有明显跃升。而这次更新后，“大家都在关注分数，但真正关键的是效率——很多任务成本不到1美元，却能达到接近80%的完成度”。

从使用路径来看，谷歌正在继续强化其平台化布局。开发者目前可以通过 Gemini API 、Google AI Studio、Gemini CLI、Android Studio(预览版)等工具调用模型;企业侧则接入 Vertex AI 和 Gemini Enterprise;普通用户则可在 Gemini App 和 NotebookLM 中直接使用，其中Pro和Ultra订阅用户拥有更高额度。

如果说榜单成绩代表能力上限，那么官方展示的案例则更能体现模型能力的进化。

在一个演示中，Gemini 3.1 Pro生成了一套完整的交互式3D椋鸟群舞系统：模型不仅编写了实时渲染的视觉代码，还设计了基于手部追踪的交互逻辑，并生成随鸟群运动动态变化的音乐。最终呈现的并非单一代码片段，而是一个融合视觉、动作与声音的沉浸式体验原型。

春节档大模型再开战，谷歌 Gemini 3.1Pro跑分超Claude，成本还更低

对于研究人员、交互设计师和创意开发者来说，这意味着模型开始具备构建“多感官系统级原型”的能力，而不只是生成单一模态内容。

从官方对比效果来看，Gemini 3.1 Pro在动作连贯性、空间稳定性以及色彩表现上，相较3.0 Pro也有明显提升，多模态生成正逐步从“可用 ”走向“可控” 。

春节档大模型再开战，谷歌 Gemini 3.1Pro跑分超Claude ，成本还更低

很多开发者已经开始用Gemini 3.1 Pro手搓各种应用，一位日本用户分享，他正使用 “Antigravity + Gemini 3.1 Pro” 进行游戏开发，并感叹：“随着 Gemini 3.1 Pro 的迭代，其对日语的响应范围和准确度都明显提升，目前的开发体验非常不错。 ”

春节档大模型再开战，谷歌 Gemini 3.1Pro跑分超Claude，成本还更低

另一位网友则直接晒出了落地页的设计成果，并给出了高度评价：“在设计落地页方面，效果简直太棒了。” 他还附上了自己在使用过程中的精确提示词。

春节档大模型再开战，谷歌 Gemini 3.1Pro跑分超Claude，成本还更低

值得注意的是，在能力明显提升的情况下，Gemini 3.1 Pro Preview的定价却与上一代基本持平：输入价格为2美元(≤200k tokens)/4美元(>200k tokens)，输出价格为4美元(≤200k tokens)/18美元(>200k tokens)。模型效率显著提升。

去一年，大模型竞争的核心指标经历了一次变化：从最初的参数规模，到榜单分数，再到如今的“性能/成本比” 。Gemini 3.1 Pro的发布，很大程度上体现了这一趋势——真正的竞争不再是谁更强，而是谁更便宜地做到同样强。

模型进化的速度仍然让人感到不真实。一位开发者在社区感慨：“一周前，Claude还是最好的模型;下一周，又换了一个新的冠军。”

温馨提示：财经最新动态随时看，请关注网APP 。

法律免责声明: 该文件不包含我们的交易价格记录、任何金融工具的交易条约或招标文件。XM对于该信息所产生的作用和影响不承担任何责任。对于该信息的准确性或完整性，不提供任何陈述或保证。因此，任何对此信息采取行动的人需完全自行承担风险。研究和分析没有考虑任何具体的投资目标、财务状况和可能会接收到它的特定需求人群。

该文件并没有以相关法律要求来进行编写以突出研究的独立性，而是被作为一种营销传播手段进行展示。尽管并无规定禁止我们在研究报告公开之前进行交易，但在此研究报告提交给客户之前，我们不会试图提前利用这一优势进行交易。我们的目标是建立和维持有效的组织与行政安排，以便采取一切合理步骤，防止利益冲突构成或造成损害客户利益的重大风险。我们实行独立的政策，这使得我们的员工必须竭尽全力以客户利益为先。

差价合约是杠杆类产品。该类商品交易可能并不适合于每一个人，并且会导致您的投资资本全部亏损，所以请确保您已经完全了解了所涉及的风险。

免责声明：免使用本站内容引起的任何损失，本站概不负责。认为内容有侵权嫌疑，请立即通知，我们会及时更改或删除。解释权归本站所有。风险提示: 外汇保证金交易和CFD交易存在高风险，未必适合所有投资者。请在交易前谨慎考虑投资目标、经验水平和风险偏好。