文章来源:万象ai发布时间:2025-03-07 10:16:01
北京时间凌晨4点钟Openai举行一个14分钟左右的直播活动,发布最新大模型GPT-4.5,OpenAI在新闻稿中表示,这是公司有史以来最大、最好的聊天模型,在计算效率上较GPT-4提升超过10倍,我们看看,同GPT-4o相比较,具体有哪些改变和提升。

在知识准确性和幻觉率方面:GPT - 4.5在AIME2024基准测试里得了36.7%,GPT - 4o才9.3%,可见GPT - 4.5知识准确性提升很大。像“人类的第一种语言是什么”这种问题,GPT - 4.5会诚实说这是未解之谜,幻觉答案减少了。
世界知识和理解上:GPT - 4.5通过多种优化有了更广知识和更深理解能力,不再乱说了,可靠性提高。
人类偏好与对话能力:人类偏好测试里GPT - 4.5更受欢迎。它能更好理解人类想法,情商更高地对话,对微妙线索和隐含期望把握更细腻,审美直觉和创造力更强。
技术进步方面:GPT - 4.5有新的可扩展技术,能用小模型数据训练出强大模型,可引导性、细节理解和自然对话能力都提升了。
推理与应用能力:GPT - 4.5虽不是专门的推理模型,但简单有挑战的知识问题能回答得不错,代码编写、物理问题解决也还行,不过有些地方比不上Claude 3.7这种专门的推理模型。
价格:GPT - 4.5使用成本比GPT - 4o高多了。每百万输入输出费用,GPT - 4.5是75美元,GPT - 4o是3美元;输出费用GPT - 4.5是150美元,GPT - 4o是15美元,GPT - 4.5成本是GPT - 4o的好几倍。
功能与限制方面:GPT - 4.5功能更多,像搜索、文件和图像上传、画布写作和编码都能支持,但不支持语音、视频和屏幕共享等多模态功能,这方面比GPT - 4o差些。
上一篇: FLUX 全生态讲解丨Lora与Controlnet工作流搭建丨玩FLUX看这篇就够了!
本次视频主要介绍了FLUX生态系统的各个方面,包括模型的安装和使用方法,FLUX的功能,工作流的搭建,以及Lora和ControlNet的整合。视频通过详细的讲解和示例,展示了FLUX在图像生成和处理方面的多样性和高效性。观众评论反映了对视频内容的认可,认为视频帮助他们更好地理解和应用FLUX的技术。
下一篇: GPT-4.5发布:情商和无监督学习能力提升、“胡说八道”幻觉现象减少。
GPT-4 5是OpenAI于2025年2月27日发布的最新AI模型,作为GPT-4的升级版本,GPT-4 5在在情商、知识库扩展和幻觉现象减少等多个方面有非常明显的提升。
相关攻略 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
最新资讯 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
更新时间:2025-07-25
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
更新时间:2025-07-25
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
更新时间:2025-07-25
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
更新时间:2025-07-25
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
更新时间:2025-07-25
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
更新时间:2025-07-25
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
更新时间:2025-07-25
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
更新时间:2025-07-25
宁德时代领投,「银河通用」完成超10亿元新一轮融资
更新时间:2025-07-25
【译】万字长文解读:生成式AI的21个设计模式、示例及应用策略
更新时间:2025-07-25