Gemini 3夜袭发布，大模型新王来了

xinwen.mobi · 发表于 2025-11-20 07:18:46

刚刚，谷歌深夜甩出王炸：这个新模型，全球只有7个人能赢它
就在昨晚，整个科技圈又被一场突如其来的发布给炸醒了。谷歌这次没有预告，直接甩出了一枚深水炸弹——Gemini 3 Deep Think 迎来了一次重大升级。

江湖上流传着太多关于大模型谁更强的话题，但这次，谷歌直接把天花板给捅破了。不说那些让人头大的技术术语，咱就看看这新模型到底有多硬核。

打遍天下无敌手，编程强到没朋友
先来看一组让人倒吸一口凉气的数据。

在国际竞技编程平台 Codeforces 上，Gemini 3 Deep Think 拿下了一个匪夷所思的分数：3455 Elo 。

这个分数意味着什么？放眼全球，只有7个活生生的人类能在编程比赛里压它一头。一年前，最强选手也就摸到 2727 分，排名第一百开外。现在这家伙直接空降世界第八，把几百万程序员甩在了身后。以后再说程序员的饭碗稳如泰山，估计得掂量掂量了。

这还没完。在一个被称为“人类最后考试”的终极难度的测试里，它拿下了 48.4% 的成绩，硬生生把之前的所有对手都踩在了脚下。更别提那个专门测试 AI 推理能力的 ARC-AGI-2 基准，它直接干到了 84.6% 。要知道，几个月前它才考了 45 分，这进步速度，比学霸期末突击还猛。

不只会刷题，还能当科研合伙人
如果光会考试，那也就是个书呆子。但 Gemini 3 Deep Think 这次的目标，是直接杀进实验室和工程现场。

谷歌这次特意拉上了一帮顶尖科学家和研究员一起调教它，目的就是为了解决那些真实世界里没标准答案、数据一团乱麻的复杂难题。

效果是立竿见影的。罗格斯大学有位数学家，拿它去审阅一篇高深的数学论文，结果这家伙一眼就揪出了一个人类同行评审都没发现的逻辑漏洞。

杜克大学的一个实验室想找新材料，用它来优化晶体生长的配方。结果 Deep Think 设计出的工艺，长出来的薄膜厚度直接超过了 100 微米，达到了以前想都不敢想的精度。

更接地气一点，现在拿一张手绘的设计草图丢给它，它能直接分析图纸、建模，最后生成一个可以拿去 3D 打印的文件。从涂鸦到实物，中间的这一大截路，它全包了。

一个能打的都没有？其实各有千秋
当然，Gemini 3 Deep Think 也不是全能神。在这次升级后，大家把市面上最顶尖的几个模型拉到一起比了比。

在抽象推理、专家级难题和刚才说的编程竞赛这几个领域，Deep Think 确实是遥遥领先，把 Claude Opus 4.6 和 GPT-5.2 都比下去一大截。

但要是比软件工程的实际任务、操作电脑终端，或者处理超长文本的上下文，Claude 那边还攥着优势。看来这年头，大模型也开始搞“专业分工”了，没谁能把所有好处都占了。

目前，这个新模型只对订阅了 Google AI Ultra 的用户开放，一个月 249.99 美元，确实不便宜。但谷歌也开了口子，让一部分研究员和企业能提前用上 API 。

这场发布就像一记重拳，告诉全世界：AI 赛道的竞赛，还远没到终点。从今天起，全球顶级程序员榜单里，得给这位“硅基选手”永久留一个位置了。

		自动登录	找回密码
密码			立即注册

Gemini 3夜袭发布，大模型新王来了

相关帖子