文章来源:08ai导航网发布时间:2025-08-06 17:04:12
8月6日消息,科技媒体webpronews昨日(8月5日)发布博文,报道称谷歌DeepMind于8月5~7日在Kaggle的GameArena平台上,举办“AI国际象棋”比赛,邀请OpenAI、Anthropic、谷歌、Kimi、Deepseek在内的顶尖模型一较高下。
DeepMind表示,本次“AI国际象棋”比赛的目的,是检验顶级AI模型的推理能力。本次活动将于8月5~7日举行,每日举办一轮比赛,由国际象棋大师HikaruNakamura和流媒体播主LevyRozman解说。
在AI发展的重要时刻,这场象棋对决提供了一个严格的测试,以评估AI的预见和策略调整能力,文本基础的格式解决了许多大型语言模型在视觉象棋盘表示上的难题,提供了一个更公平的推理能力测试。
附上本次参赛选手如下:
Gemini2.5Pro(Google)
Gemini2.5Flash(Google)
o3(OpenAI)
o4-mini(OpenAI)
Claude4Opus(Anthropic)
Grok4(xAI)
DeepSeekR1
Kimik2(MoonshotAI)
根据首日战况,OpenAI的o4mini胜过Deepseek-R1、OpenAI的o3超过KimiK2Instruct模型、谷歌的Gemini2.5Pro胜过ClaudeOpus4、xAI的Grok4模型超过谷歌的Gemini2.5Flash。
相关攻略 更多
最新资讯 更多
国际象棋最强AI鸣锣开赛:首日战果公布,OpenAI的o3、xAI的Grok4等晋级
更新时间:2025-08-06
美团宣布给中小商户发放助力金:单店最高5万免费开放AI工具
更新时间:2025-08-06
狂揽70亿挑战DeepSeek,AI创企被曝新融资,被英伟达押宝,团队大牛云集
更新时间:2025-08-06
估值达5000亿美元,消息称OpenAI就股份出售进行谈判
更新时间:2025-08-06
你和ChatGPT的私密对话正在全网裸奔,网友炸锅:我把ChatGPT当知己,它却把我隐私挂网上
更新时间:2025-08-06
Claude Opus 4.1被曝即将发布,Anthropic靠两大客户API收入超OpenAI
更新时间:2025-08-06
马斯克的Grok可生成名人裸体视频,年龄验证被指形同虚设
更新时间:2025-08-06
马斯克Waymo在美肉搏一城一池,欧洲被中国萝卜抢占了
更新时间:2025-08-06
维基百科严打AI生成劣质条目:一经发现立马删除
更新时间:2025-08-06
13岁小孩哥当上CEO,22岁造独角兽,少年帮扎堆辍学,集结硅谷创业
更新时间:2025-08-06