文章来源:万象ai发布时间:2025-07-29 16:13:25
人工智能已经在许多领域大放异彩,从写文章、编写代码,到撰写法律文书、生成图像、甚至进行科学研究,AI 的能力正在不断刷新人类的认知。尤其是像 ChatGPT 这样的语言模型,更是在自然语言处理方面达到了前所未有的高度。然而,最近的一场实验却揭示了人工智能的另一个面向 —— 它在一些看似“简单”的任务面前,可能并没有我们想象中那么聪明。
这场有趣的实验由工程师罗伯特・卡鲁索发起,他让 ChatGPT 与1977年发布的经典游戏机雅达利2600(Atari 2600)上的《Video Chess》进行了一场国际象棋对决。雅达利游戏机可以说是电子游戏史上的“活化石”,其硬件性能远远无法与今天的智能手机相比。但在这场人机对决中,结果却出人意料:ChatGPT 居然败下阵来,且错误频出。
在90分钟的对战中,ChatGPT 的表现可以说是漏洞百出:
混淆棋子:它竟然将“车”(Rook)误认为“象”(Bishop),这是国际象棋新手最容易犯的低级错误。
战术失误:面对明显的兵的分叉(pawn fork)攻击机会,ChatGPT 没有抓住。
棋盘混乱:多次搞不清楚棋子的实际位置,对局势的判断出现偏差。
图标抱怨:它甚至试图将失误归咎于雅达利的图形界面太抽象。
即便在后续使用标准国际象棋棋谱表示法后,ChatGPT 的表现依旧不理想,显示出它在下棋逻辑推演上的明显短板。正如卡鲁索调侃的那样:“ChatGPT 所犯的错误足以让它在三年级的国际象棋俱乐部里被嘲笑。”
很多人可能会疑惑,既然 AI 曾在 1997 年让 IBM 的深蓝(Deep Blue)击败了国际象棋世界冠军卡斯帕罗夫,为何 ChatGPT 却连雅达利游戏机都打不过?
关键在于:ChatGPT 和深蓝的设计目标完全不同。
深蓝:这是一个专门为国际象棋设计的超级计算机,内置了复杂的棋谱数据库和强大的计算能力,可以在极短时间内评估上百万种走法,寻找最优解。它的本质是一个“穷举搜索引擎”。
ChatGPT:它是一个大型语言模型,主要依靠从海量文本中学习到的语言模式进行“预测下一步词语”的生成。虽然它能描述国际象棋规则、分析战术,甚至能写出关于国际象棋的科普文章,但它并没有专门训练用来真正对弈的能力。换句话说,ChatGPT “懂规则”,但并不“会下棋”。
可以用一个简单的比喻来理解:
深蓝像一个记忆力超群、计算力爆表的棋手;而 ChatGPT 更像一个会讲棋理、会复盘讲故事的解说嘉宾。让解说嘉宾上场比赛,自然不会有好结果。
这次实验其实并不代表 ChatGPT 无能,反而提醒我们:AI 并非无所不能,它的能力取决于其设计目标和训练数据。
目前的语言模型在处理纯逻辑推理、复杂状态模拟、实时博弈等任务时,还远远不如专门训练的领域模型。例如:
ChatGPT 可以写小说,却不适合做法官;
可以讲象棋战术,却不适合比赛下棋;
可以写代码片段,却未必能胜任严苛的安全级别编程任务。
正是因为 AI 仍有短板,才需要我们在应用 AI 时,正确认知其优势与局限,合理使用,避免“盲目神化”。
当然可以!事实上,像 AlphaZero 这样的专门博弈 AI,已经能在国际象棋、围棋等复杂对弈中全面超越人类。但这些 AI 背后用的是完全不同的技术体系,比如:
深度强化学习(Deep Reinforcement Learning)
蒙特卡洛树搜索(Monte Carlo Tree Search)
相比之下,通用语言模型要想具备类似能力,还需要在多模态理解、状态建模和长时记忆方面进一步突破。
相关攻略 更多
最新资讯 更多
ChatGPT在国际象棋比赛中被48年前的雅达利2600游戏机“吊打”
更新时间:2025-07-29
这个神秘指标,决定了你的AI产品是下一个独角兽还是炮灰,原来爆款是可被量化和预测的
更新时间:2025-07-29
Agent不长记性咋整?试试G-Memory,可进化的有组织“集体大脑”
更新时间:2025-07-29
三箭齐发,苹果AI蓝图曝光,Siri2.0只是冰山一角?
更新时间:2025-07-29
放弃博士学位加入OpenAI,他要为ChatGPT和AGI引入记忆与人格
更新时间:2025-07-29
AI“辣聊”翻车,谁在允许偶像被“分身擦边”?
更新时间:2025-07-29
AI加码创新:世界首款由人工智能从配方设计到模拟“品尝”的能量饮料
更新时间:2025-07-29
海外2025人才报告曝光:Anthropic狂挖海外AI专家,留存率80%碾压全球
更新时间:2025-07-29
ClackyAI:用云端Agent开启Coding下一站
更新时间:2025-07-29
不是吧?现在还有人手动去抄网站页面?这3个工具10分钟「像素级复制」一个网站
更新时间:2025-07-29