找回密码
 立即注册
搜索

Gemini 3夜袭发布,大模型新王来了

[复制链接]
xinwen.mobi 发表于 2025-11-20 07:18:46 | 显示全部楼层 |阅读模式
刚刚,谷歌深夜甩出王炸:这个新模型,全球只有7个人能赢它
就在昨晚,整个科技圈又被一场突如其来的发布给炸醒了。谷歌这次没有预告,直接甩出了一枚深水炸弹——Gemini 3 Deep Think 迎来了一次重大升级 。

江湖上流传着太多关于大模型谁更强的话题,但这次,谷歌直接把天花板给捅破了。不说那些让人头大的技术术语,咱就看看这新模型到底有多硬核。

打遍天下无敌手,编程强到没朋友
先来看一组让人倒吸一口凉气的数据。

在国际竞技编程平台 Codeforces 上,Gemini 3 Deep Think 拿下了一个匪夷所思的分数:3455 Elo 。

这个分数意味着什么?放眼全球,只有7个活生生的人类能在编程比赛里压它一头 。一年前,最强选手也就摸到 2727 分,排名第一百开外。现在这家伙直接空降世界第八,把几百万程序员甩在了身后。以后再说程序员的饭碗稳如泰山,估计得掂量掂量了。

这还没完。在一个被称为“人类最后考试”的终极难度的测试里,它拿下了 48.4% 的成绩,硬生生把之前的所有对手都踩在了脚下 。更别提那个专门测试 AI 推理能力的 ARC-AGI-2 基准,它直接干到了 84.6% 。要知道,几个月前它才考了 45 分,这进步速度,比学霸期末突击还猛。

不只会刷题,还能当科研合伙人
如果光会考试,那也就是个书呆子。但 Gemini 3 Deep Think 这次的目标,是直接杀进实验室和工程现场。

谷歌这次特意拉上了一帮顶尖科学家和研究员一起调教它,目的就是为了解决那些真实世界里没标准答案、数据一团乱麻的复杂难题 。

效果是立竿见影的。罗格斯大学有位数学家,拿它去审阅一篇高深的数学论文,结果这家伙一眼就揪出了一个人类同行评审都没发现的逻辑漏洞 。

杜克大学的一个实验室想找新材料,用它来优化晶体生长的配方。结果 Deep Think 设计出的工艺,长出来的薄膜厚度直接超过了 100 微米,达到了以前想都不敢想的精度 。

更接地气一点,现在拿一张手绘的设计草图丢给它,它能直接分析图纸、建模,最后生成一个可以拿去 3D 打印的文件 。从涂鸦到实物,中间的这一大截路,它全包了。

一个能打的都没有?其实各有千秋
当然,Gemini 3 Deep Think 也不是全能神。在这次升级后,大家把市面上最顶尖的几个模型拉到一起比了比。

在抽象推理、专家级难题和刚才说的编程竞赛这几个领域,Deep Think 确实是遥遥领先,把 Claude Opus 4.6 和 GPT-5.2 都比下去一大截 。

但要是比软件工程的实际任务、操作电脑终端,或者处理超长文本的上下文,Claude 那边还攥着优势 。看来这年头,大模型也开始搞“专业分工”了,没谁能把所有好处都占了。

目前,这个新模型只对订阅了 Google AI Ultra 的用户开放,一个月 249.99 美元,确实不便宜 。但谷歌也开了口子,让一部分研究员和企业能提前用上 API 。

这场发布就像一记重拳,告诉全世界:AI 赛道的竞赛,还远没到终点。从今天起,全球顶级程序员榜单里,得给这位“硅基选手”永久留一个位置了。


回复

使用道具 举报

QQ|周边二手车|手机版|标签|xml|txt|新闻魔笔科技XinWen.MoBi - 海量语音新闻! ( 粤ICP备2024355322号-1|粤公网安备44090202001230号 )|网站地图

GMT+8, 2026-2-18 01:22 , Processed in 0.043029 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表