文章来源:万象ai发布时间:2025-03-07 16:49:26
AI奇点网7月19日报道丨今天一早,ChatGPT再度上新。
当地时间7月18日,OpenAI发布一款「GPT-4o mini」的新模型——是目前旗下最强的GPT-4o的小参数量简化版,用中国人的话讲便是「青春版」,而且是完全免费的。?

从OpenAI分享的基准测评结果来看,GPT-4o mini在推理能力上超越了谷歌Gemini Flash和Anthropic Claude 3 Haiku等竞争对手的“中杯”版本。

GPT-4o mini 在数学推理和编程任务方面也同样表现出色,远超市场上的其他小型模型。
在 MGSM 数学推理能力基准测试中,GPT-4o mini 得分达到了 87.0%,而 Gemini Flash 的得分为 75.5%,Claude Haiku 的得分为 71.7%。
GPT-4o mini 在 HumanEval 基准测试中同样再次展现优势,得分达到 87.2%,而 Gemini Flash 的得分为 71.5%,Claude Haiku 的得分为 75.9%。
图片
而在多模态推理 MMMU 中,GPT-4o mini 也表现出色,得分为 59.4%,而 Gemini Flash 得分为 56.1%,Claude Haiku 得分为 50.2%。
值得注意的是,作为上一代的大模型,GPT-3.5 Turbo 在这些基准测试中的得分均不如 GPT-4o mini。OpenAI表示,GPT-4o mini是「目前功能最强大、性价比最高的小参数模型」,这款新模型支持50种语言,将替代陈旧的GPT-3.5。
GPT-4o mini支持128K长文本输入,与完全版无异,主打低成本的API调用和快速响应能力,适用于多种多模态应用场景。
单价方面,每100万Tokens仅为15美分,还不到一毛钱,比GPT-3.5 Turbo降价60%,是目前同级参数下性价比最高的大模型。
「GPT-4o mini」即日起上线ChatGPT并无偿向网友提供使用,而GPT-3.5直接下线。
而其完整版的GPT-4o则是今年5月OpenAI发布的最新旗舰大模型,继续以限量对话的方式免费向用户提供服务。

GPT-4o mini的推出,意味着OpenAI正试图直面市场越来越多竞争对手的局面,包括微软Phi、谷歌Gemma、Anthropic Claude 3 Haiku在内的产品,都主打小参数。所谓「以小博大」,在新式训练与蒸馏手段下,小参数模型并不比大参数的模型表现差,反而十分接近。
外媒CNBC对此评价,GPT-4o是OpenAI首个多模态模型,「GPT-4o mini」是OpenAI尝试面向更多的用户群体提供多模态应用能力,让ChatGPT可以驾驭文本、图像、音频和视频等不同的媒介,同时继续确保自己在行业内的领导地位。
相关攻略 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
最新资讯 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
更新时间:2025-07-25
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
更新时间:2025-07-25
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
更新时间:2025-07-25
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
更新时间:2025-07-25
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
更新时间:2025-07-25
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
更新时间:2025-07-25
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
更新时间:2025-07-25
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
更新时间:2025-07-25
宁德时代领投,「银河通用」完成超10亿元新一轮融资
更新时间:2025-07-25
【译】万字长文解读:生成式AI的21个设计模式、示例及应用策略
更新时间:2025-07-25