文章来源:万象ai发布时间:2025-03-10 12:00:25
AI奇点网7月10日报道丨7月9日,国内权威的AI大模型中文测评基准机构SuperCLUE对外发布的6月中文大模型月度测评报告显示,阿里的通义千问开源大模型Qwen2-72B-Instruct以卓越的表现雄踞国内大模型能力的第一位,同时也是全球范围内最强的开源大模型。

纵观6月大模型赛道的变化,最显著的特征便是国产模型迅速拉近了与国际领先者的身位。绝大部分的国产闭源模型均超过了GPT-3.5,而阿里通义的最强开源模型距离GPT-4o大约还有5%的差距。
AI奇点网从报告了解到,综合海内外33款主流大模型的综合测评结果,阿里Qwen2-72B取得总分77分的高分,与Claude-3.5-Sonnet并列第二,仅次于GPT-4o。

Qwen2-72B的成绩也领先百度文心一言4.0、科大讯飞星火V4.0、Meta的Llama-3-70B等知名大模型有小半个身位。
具体来看,在理科、文科和Hard(困难模式)三个维度的具体测评中,Qwen2-72B展现了全面而均衡的能力。
尤其是数学计算、逻辑推理和代码测评等理科任务方面展现了强劲实力,Qwen2-72B与GPT-4o的分差仅为5分;在文科任务和Hard(困难模式)的任务上,Qwen2-72B与GPT-4o几乎不相上下。

本期报告最值得一提的是,其中一项端侧小尺寸模型的测评显示,阿里通义Qwen2-7B(70亿参数)的综合性能超越了上一代自研320亿参数的Qwen1.5-32B版本,以及130亿参数的Llama-3-8B-Instruct,勇夺“迷你模型”第一。
这意味着,即便是不同重量级的较量下,大模型依然可以在体积上进行大幅的“瘦身”优化,以实现同等乃至胜出的「以小博大」表现,极大提升了端侧模型落地的可行性,为手机平板笔记本等设备的AI本地加载带来无限可能。
报告全文阅读:https://www.cluebenchmarks.com/superclue_24h1
上一篇: Unitree H1:宇树科技首款通用人形机器人
Unitree H1:宇树科技首款通用人形机器人_映技派,专注ai人工智能!,宇树科技(Unitree Robotics)推出的Unitree H1是一款全尺寸通用人形机器人,是宇树科技首款通用人形机器人。
下一篇: 宇树科技Unitree H1“福兮”人形机器人:2025蛇年春晚舞台上的AI艺术革新
宇树科技Unitree H1“福兮”人形机器人:2025蛇年春晚舞台上的AI艺术革新_映技派,专注ai人工智能!,在2025年蛇年春晚的舞台上,宇树科技以其最新研发的机器人Unitree H1“伏羲”掀起了一场科技与传统文化交融的视觉盛宴。这场名为《秧BOT》的表演中,机器人身着花棉袄,手持红绸手绢,以精准的节奏扭动身躯,将传统秧歌舞与现代AI技术完美结合,成为春晚历史上的标志性创新之一。
相关攻略 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
最新资讯 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
更新时间:2025-07-25
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
更新时间:2025-07-25
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
更新时间:2025-07-25
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
更新时间:2025-07-25
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
更新时间:2025-07-25
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
更新时间:2025-07-25
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
更新时间:2025-07-25
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
更新时间:2025-07-25
宁德时代领投,「银河通用」完成超10亿元新一轮融资
更新时间:2025-07-25
【译】万字长文解读:生成式AI的21个设计模式、示例及应用策略
更新时间:2025-07-25