首页 > AI教程资讯

谢赛宁敲响学界警钟!AI研究可能陷入一场注定失败的有限游戏

文章来源:万象ai发布时间:2025-07-29 16:23:01

凌晨三点的 AI 实验室,键盘敲击声在空荡的房间回响。屏幕上,博士生小王、小李、小赵正疯狂调整模型参数,只为在 NeurIPS 截稿前将准确率从 98.2% 刷到 98.5%。

这样的场景,在如今的 AI 学术圈早已见怪不怪。当科研沦为数据工厂里的流水线作业,当研究者们为了顶会论文疲于奔命,我们不禁要问:曾经充满探索乐趣的 AI 研究,何时已经变味儿?

大神谢赛宁在 CVPR 2025 的演讲,正是对这场学术内卷发讲出了犀利的观点:现在的人工智能研究,可能要沦为一场「有限游戏」。

谢赛宁还分享了他从《有限与无限游戏》(James P. Carse著)这本书中获得了灵感,书中的观点令人深省。这本书经常出现在商业背景中,但他被其与研究的关联性所震撼,并表示当今世界真的需要更多无限的参与者。

不少网友认为这是一个非常有趣的观点,一场精彩的演讲,同样也非常好的回答了「什么是研究」。

AI 研究到底是什么?

在这次内容分享的开头,谢赛宁就向大家介绍了 詹姆斯・卡斯(James P. Carse) 的两种分类:有限游戏和无限游戏。

这两种不同的游戏主要有以下区别:

当然,谢赛宁在这次演讲中给出了自己的回答:研究理应是一场「无限游戏」。此外,他还谈了三个主题,分别是:

我是我自己的天才

为什么人工智能研究正面临变成有限游戏的风险?

没有人能独自玩一场游戏

AI 研究理应是一场「无限游戏」

那么为什么 AI 研究应该是「无限游戏」,这源于它的四个特征:

我是我自己的天才

谢赛宁亮出自己的观点:你可以并且应该自己掌控游戏。

首先问自己一个问题:我们为什么要发表论文?这里,知名思想家、作家 Hannah Arendt 曾说过的一段话可以作为参考,「我应该追求影响力吗?不,我想要理解。当他人理解并以我所理解的同样方式时,这会给我一种满足感和归属感。」

因此,谢赛宁提出要「设计你的游戏玩法。理解、分享并在这场无限的游戏中脱颖而出,不是通过赢得他人,而是做好自己、激励他人。也就是讲好故事、研究品味。」

研究者有时就像时装设计师,要对一张表、一条信息精雕细琢,要提出有简洁、原则性的方法,还要逐步消融实验并隔离混淆变量,为自己的项目打造一个专属主页。

谢赛宁表示,你也要为自己的论文、自己的工作、甚至是本人,打造鲜明的品牌,别再「随波逐流」。

在信息爆炸的时代,人们没有那么多时间来读论文了,研究者要注重如何实现更高效的知识共享以及自身工作的传播。

谢赛宁表示,已经有很多研究者在使用他的模板,对此表示非常感谢。

模板展示:

为什么人工智能研究正面临变成有限游戏的风险?

谢赛宁接着探讨了 AI 研究有可能陷入有限游戏困境的原因,并指出无限玩家必须要反抗。

如今,一些令人担忧的研究模式正在肆虐,比如一个主要的有限元研究玩家(如 OpenAI)发表了一篇新论文(如 4v、r1、grpo、o1、4o),接着便会出现大批的追随者以及相关论文,每个人都争相就同一个主题发表论文。

这意味着:谁发表的早,谁就能获得更多引用量和曝光度,成为赢家;谁发表的晚,往往会被忽视,成为输家。不仅如此,一旦出现一篇「奠基之作」,其他人也会快速放弃这个主题。

因此,研究者尤其是学生和早期研究者面临着巨大的压力,为了获得有限的认可而加入到激烈的竞争中已经成为必然,这令人精疲力尽且难以持续。

那么,学术激励机制是否存在缺陷呢?优先考虑发表的快慢而非研究深度或者创造力,奖励快速成功而非持续贡献。如果学界玩的是一场有限的游戏,则注定会失败。

如何破局呢?谢赛宁认为要定义新的问题,毕竟问题是层出不穷的。他以自己与 Penghao Wu 合作完成的一个项目 V * 为例进行说明,该项目引导视觉搜索作为多模态大语言模型的核心机制。

论文地址:https://arxiv.org/pdf/2312.14135.pdf

在当时,多模态 LLM 缺乏这种视觉搜索机制,从而阻碍了它们关注重要的视觉细节,尤其在处理高分辨率和视觉繁杂的图像时。他们提出的这种机制利用 LLM 中的世界知识进行高效的视觉查询,在与多模态 LLM 结合时可以增强协作推理、上下文理解以及对特定视觉元素的精准定位。

如今,OpenAI 最新版 o3 和 o4 mini 在发布的时候,在模型基准测试中加入了 V * 视觉搜索,并在标题中直接写上了利用图像来思考。

谢赛宁总结了一下:有限游戏或许能带来财富、地位、权力和认可;但无限游戏能提供更深层次、更有意义的东西。

不过,我们不能指望初级研究者从一开始就自然地接受这种放眼长远的模式,问题在于:如何才能创建一种能够孕育并维持这种模式的正反馈循环?

没有人能独自玩一场游戏

「要是研究计算机视觉,你这辈子都找不到工作。」

—— 某博客文章,2010 年

「你应该投身计算机视觉领域。CVPR 是开放包容的,从不搞学术壁垒。」

—— 某位导师,2013 年

从 2010 年的求职冷门到 2013 年的开放前沿,短短三年的转向印证了技术领域的迭代速度。10 年这句看似预言失败的评论,恰反衬出技术领域十年间的颠覆性变革 —— 如今 CV 已成为 AI 最炙手可热的分支之一,也印证了科研方向选择中「长期主义」的价值。

谢赛宁做出总结:玩家从不稀缺,更多玩家并不总意味着无限游戏。

他在演讲结尾呼吁科研进步不仅依赖个体突破,更需群体对开放协作的维护。

别把我们的学术社区视为理所当然 —— 我们每个人都肩负着让它变得强大且包容的责任。

彩蛋悬念:演讲幻灯片的结尾是超可爱 LABUBU。这次幻灯片制作超级精美,记得点开参考链接欣赏一下哦。

参考链接:

https://www.canva.com/design/DAGp0iRLk9g/8QLkIDov8ez1q6VvO8nnpQ/edit