文章来源:万象ai发布时间:2025-07-15 12:35:05
又一个让大模型几乎全军覆没的难题出现了。
注意看,这张图画的是谁?
如果不够明显,那再眯着眼睛看呢。没错,就是蒙娜丽莎。
这张来自日本艺术家北冈秋吉前几天创作的一张图,结果直接把一众大模型难倒了。
ChatGPT只能分辨出这是一张脸。。
Gemini则是直接识别错了人。
网友:懂了,大模型不会眯眼睛。
为了验证这一推论,咱们也进行了一波简单实测。既然直接问「画的是谁」问不出来,那给一点提示,让它可以尝试眯着眼睛。
首先来看ChatGPT的表现。
它能准确判断出这是一张视觉错位图,也通过「眯着眼睛」识别出来了具体的脸部轮廓,结果在最后关头识别错了。
而再让它深度思考一下,答案给不出来了。
Gemini的回答则还停留在各种颜色的条纹,也辨认出这是个侧脸的轮廓。
Grok则直接表示无法辨认,让我提供一张更清晰的照片,emmm…
再来看看国产玩家的表现,还是挑出三个来看看。
豆包的回答与Gemini类似,能够判断出图像的风格、人脸轮廓,但是无法判断具体任务。
但选择深度思考之后,它深入研究了故障艺术的通道分离特性,然后从黑色轮廓中判断出这是爱因斯坦(????
可能这蓬松的长发不是一个类型的吧。
将这个问题交给Qwen。负责回答这个问题的是Qwen3-235B-A22B,在完成深度思考之后,它发现了这是个人的侧脸剪影。但还是没有判断出画的这个人是谁。
而元宝、讯飞的回答如下:
△元宝
△讯飞星火
不过在一众模型全军覆没之际,也还是有得分选手。
比如o3-Pro。
网友进一步分析了原因。这可能与模型推理轨迹有关。比如像o3(非pro版)思考链路里,它通常会在 Python 中旋转、增加对比度、裁剪等。而o3-pro显然推理能力更强。
但有人怀疑了,它是不是用搜索了。
不过这被发现者驳回了。首先o3也可以用搜索,但无法做到这一点。而且从o3-pro的推理摘要中看,它只有在模糊后才能看到它(可能是通过使用工具)。而且如果只问“这是什么?”,它也不起作用。
还有尝试了三次的GPT-4o。
不过这合理怀疑,只是它偶然猜对了。
因为网友在它第一次打错之后,就给模型提示说这是一张著名的画作。于是就莫名玩起了「海龟汤」的游戏。。。
又或者让o4-mini-high先人为地模糊图像以使其“眯眼”,然后就能识别图像。
好了,感兴趣的朋友可以去尝试一下。有挑战成功的友友,可以在评论区分享下提示词经验~
参考链接:
[1]https://x.com/svpino/status/1940924964431188137
[2]https://x.com/goodside/status/1941296192656376297
上一篇: AI做SVG的终极方案,一套提示词模板无痛搞定:小红书知识卡片、数据可视化图表、原型图、动态图……
相对于文字,图像信息更能直观地传达复杂的信息和概念,其最大的优势是直观、高效、精准。作为一名数据分析师,画图是我工作中必不可少的一部分。无论是汇报时的ppt展示图、还是做计划时的流程图、亦或是小组讨论
下一篇: 获得610万美元A轮融资,16000名客户预定,“超逼真”小狗机器人借宠物疗愈经济发力
“我们早在几年前便观察到,机器人伴侣的需求正在持续上升,并判断这个市场正站在指数级增长的临界点。”医疗健康领域资深投资机构Caduceus Capital Partners的高级管理合伙人Dave V
相关攻略 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
最新资讯 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
更新时间:2025-07-25
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
更新时间:2025-07-25
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
更新时间:2025-07-25
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
更新时间:2025-07-25
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
更新时间:2025-07-25
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
更新时间:2025-07-25
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
更新时间:2025-07-25
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
更新时间:2025-07-25
宁德时代领投,「银河通用」完成超10亿元新一轮融资
更新时间:2025-07-25
【译】万字长文解读:生成式AI的21个设计模式、示例及应用策略
更新时间:2025-07-25