突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

文章来源：08ai导航网发布时间：2025-08-21 09:04:44

刚刚Grok-3免费开放了！DeepSearch和Think两大模式加持，刚上了热搜的「9.11和9.9哪个大」终于能做对了（但没全对），甚至1分钟秒解MIT积分赛题。然而，它刚一亮相就遭OpenAI研究员「打假」，被对方质疑作弊。

世界首个20万块GPU（另有说法是10万）训出的Grok-3，官宣人人可用了！

DeepSearch、Think两大模式，同时上线。唯独遗憾的是，Big Brain还在雪藏。

Grok 3全部免费开放，直到服务器崩溃为止

一边，AI科技圈开发者激动地奔走相告，另一边，OpenAI和xAI直接打起来了。

先是本科辍学的OpenAI研究员Aidan McLaughlin，谴责Grok-3在评测中用基于64个样本进行多数投票刷分。

灰色阴影区域表示在64个样本下的多数投票一致性表现

随后，OpenAI应用研究主管Boris Power更是丝毫不留情面，「看到Grok团队在评估中作弊和欺骗的动机，真令人失望。简而言之，o3-mini在每个评估中都优于Grok-3。Grok-3确实是一个不错的模型，但没有必要过度宣传」。

对此，xAI高级工程师Igor Babuschkin，「完全不对。我们只是用了和你们一样的方法」。

从下图中不难看出，o1-preview和o1确实有同款「阴影」。

不过，根据McLaughlin的解释道，OpenAI o3-mini并没有使用这种方法。

OpenAI与xAI针锋相对，也不是一天两天了，好在他们的竞争，利好所有人。

话不多说，直接上实测吧。

Grok-3是不是世界上最聪明的AI还有待考察，但它现在确实可以生成照片级真实的图像。

X网友Min Choi分享了10个案例。

在海滩上的随意自拍

疯狂的细节，你可以看到每根羽毛

SpaceX的火箭

图像细节程度简直令人惊异的眼睛特写

月球网络探测车

在纽约地铁上的自拍

走秀的猫咪

微型小熊猫的微距镜头

一位年轻白化男子手持绿色小狗的文艺复兴风格肖像

水池边的自拍

对此，有网友说，我们现在已经很难分清图片上的是不是现实了。

「我们已经跨越了那个门槛！」，Min说。

不过也有网友发现了它的一些缺点，比如生成正在倒立的人物时，依然会出现匪夷所思的问题。

网友实测，Grok-3在2024麻省理工积分大赛中，直接干掉o1 Pro和人类选手，并在1分02秒内解决了这个问题！

就连马斯克称赞道，简直太酷了。

添加图片注释，不超过 140 字（可选）

下一步，Grok-3或许还会推出高级语音模式，一些拿到灰度测试的网友晒出了自己的实测。

它不仅支持联网模式，还支持自定义语音模式、语音转录、音频分享等功能。

目前，默认的是Sal男性声音。此外，还有一个Ara女性声音可选。

用户界面底部有三个键：关闭退出语音模式；静音；分享

如下是转录功能的展示。

下面视频中，Grok-3不仅会唱生日快乐歌，还会笑。

上一篇: Nature认证DeepSeek成科研工具全能者，国内高校如何借力大模型？

DeepSeek的风，也是飘到了科研领域——