文章来源:万象ai发布时间:2025-07-11 09:56:21
智谱AI在其首届技术开放日(Zhipu DevDay)正式发布了新一代基座大模型GLM-4。
据智谱AI CEO张鹏介绍,GLM-4的整体性能相比上一代大幅提升,逼近GPT-4。它可以支持更长的上下文,具备更强的多模态能力。同时,它的推理速度更快,支持更高的并发,大大降低推理成本。
除此之外,GLM-4大幅提升了智能体能力,GLM-4 All Tools 实现自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。GLMs 个性化智能体定制功能亦同时上线,用户用简单的提示词指令就能创建属于自己的 GLM 智能体。
演讲中,张鹏回顾了大模型行业和智谱 AI 过去五年的发展历程。他坦言,由于起步晚、算力受限等因素的制约,今天国内大模型与国外最先进的团队还有将近一年的差距。张鹏没有回避智谱 AI 依然是「追赶者」的事实。而拿出性能非常逼近 GPT-4 的 GLM-4,智谱 AI 已经践行了自己去年年初定下的承诺。
智谱 AI 表示,此次发布的 GLM-4,在多个评测集上性能已接近或超过GPT-3.5,个别项目上几乎持平GPT-4。其中以下四个能力更新,是 GLM-4 最大的亮点:
多模态能力:推出了CogView3代,效果超过开源SD模型,逼近 DALLE-3。All Tools能力:GLM-4能自主理解复杂指令,自由调用WebGLM搜索增强、Code Interpreter代码解释器和多模态生成能力,完成复杂任务。GLMs个性化智能体定制:用户可以通过智谱清言官方网站创建属于自己的GLM智能体,无需编程基础。MaaS平台和API:GLM-4登陆了Maas平台,提供API访问,支持开发者内测Assistant API。具体来说,GLM-4可以支持128k的上下文窗口长度,单次提示词可以处理的文本可以达到300页。同时,在needle test(大海捞针)测试中,128K文本长度内GLM-4 模型均可做到几乎100%的精度召回,并未出现长上下文全局信息因为失焦而导致的精度下降问题。同时,多模态能力方面,文生图和多模态理解都得到了增强。
智谱AI CEO张鹏 | 图片来源:智谱AI
2018-2020:大模型的算法创新年
2017年,谷歌提出了Transformer机器学习模型架构,迅速席卷了整个人工智能研究领域,成为自然语言处理等相关研究的主要方法,2018到2020年,业内先后出现了BERT、GPT/GPT-2/GPT-3、T5等基于大规模无标注数据自监督学习的大规模预训练算法,可以说 2018-2020 年是大模型的算法创新年,在这段时间,智谱AI研发了属于自己的算法GLM。
2020-2022年:模型之争开始
2020到2022年,模型之争开始,基于各种预训练模型框架和开源项目,各种模型如雨后春笋般诞生。2020年的GPT-3,拥有1750亿参数,可以被视作这一战的起点,它开启了基座模型的全新时代,其在语言生成、上下文学习和知识理解等方面展现出惊人能力。
随后全球范围内掀起了一股大模型研究和研发的热潮,谷歌、Meta等国际领先公司开始不断发布百亿到千亿规模的大型语言模型,例如Gopher(2021年)、Chinchilla(2022年)、PaLM(2022年)、Claude(2022年)等等,但是这些模型都不开源,因此开源大语言模型也开始受到关注,比如Meta的OPT(2022年)、BLOOM(2022年)、LLAMA(2023年)。
智谱AI则选择在2022年开源了自己的千亿基座模型GLM-130B,这一工作引起了全世界范围的关注,包括顶尖高校斯坦福,还有公司Google、OpenAI、apple、meta都对智谱AI的模型进行了深入分析和对比。
2023年:大模型出圈
2023年,ChatGPT 推出后,大模型开始火出圈,被公众广为所知。大模型的发展不再仅限于模型的训练,更重要的是如何实现模型的产业化应用落地,大模型开始在各个领域开花并且结果。
智谱AI在2023年这一年当中基于GLM-130B研发了ChatGLM,历经3个版本的迭代,逐步具备了多模态理解、代码解释、网络搜索增强等新功能。随后智谱AI联合合作伙伴,在一年来实现了广泛的商业应用落地。
在回顾完过去5年来大模型的发展后,张鹏也总结称必须承认的一点是,和国外大模型相比,国内的大模型发展起步晚一些,加上高性能算力的限制和数据质量的差距等等,国内研发的大模型无论规模还是核心能力,与世界先进水平还存在一年左右的差距。
去年年初智谱AI承诺,「2023年底智谱AI要实现逼近最先进的GPT-4性能的全栈自主创新的GLM-4」,作为一年前定下的目标,今天可以看到,GLM-4性能已得到明显的提升,而「从标准的大模型评测角度看,整体上我们已经逼近了GPT-4」。
上一篇: 多所高校共建开源社区LAMM,加入多模态语言模型大家庭的时候到了
LAMM (Language-Assisted Multi-Modal) 旨在建设面向开源学术社区的多模态指令微调及评测框架,其包括了高度优化的训练框架、全面的评测体系,支持多种视觉模态。 ChatGPT问世以来,大语言模型(LLM)实现了跳
下一篇: 生成式人工智能 AIGC 成2023年难忘的新词印记!
近日,国家语言资源监测与研究中心发布2023年度“十大新词语”,其中,“生成式人工智能”居于首位,高度吸睛。作为贯穿全年的高热度词条,生成式人工智能,自2023年初受益于ChatGPT的横空出世迎来风生水起。由此也带
相关攻略 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
最新资讯 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
更新时间:2025-07-25
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
更新时间:2025-07-25
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
更新时间:2025-07-25
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
更新时间:2025-07-25
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
更新时间:2025-07-25
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
更新时间:2025-07-25
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
更新时间:2025-07-25
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
更新时间:2025-07-25
宁德时代领投,「银河通用」完成超10亿元新一轮融资
更新时间:2025-07-25
【译】万字长文解读:生成式AI的21个设计模式、示例及应用策略
更新时间:2025-07-25