文章来源:万象ai发布时间:2025-07-28 11:47:42
7月26日消息,在2025世界人工智能大会(简称“WAIC2025”)开幕前夕,阶跃星辰昨天在上海正式发布了新一代基础大模型——Step3,将于7月31日面向全球企业和开发者开源。
据官方介绍,Step3是阶跃星辰首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,是在模型架构创新、算法工程协同设计上的一次大胆尝试与ScaleUp。Step3采用MoE架构,总参数量321B,激活参数量38B。
Step3拥有强大的视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析,以及日常生活中的各类视觉分析问题。
Step3在MMMU、MathVision、SimpleVQA、AIME2025、LiveCodeBench(2024.08-2025.05)等榜单上取得了开源多模态推理模型的SOTA成绩。
官方称,目前,主流开源模型虽然针对解码进行了大量优化,但其优化方案主要适配国际高端芯片,在中端及国产芯片上的解码效率仍有提升空间。在架构设计阶段,Step3便充分考量系统与硬件的特性,实现广泛硬件平台上的高效推理。凭借系统和架构创新,Step3实现了行业领先的推理解码效率。
根据原理分析,Step3在国产芯片上的推理效率最高可达DeepSeek-R1的300%,且对所有芯片友好。在基于NVIDIAHopper架构的芯片进行分布式推理时,实测Step3相较于DeepSeek-R1的吞吐量提升超70%。这些都是在不牺牲激活参数量、不降低注意力容量的条件下实现的。
阶跃星辰宣布联合近10家芯片及基础设施厂商,共同发起“模芯生态创新联盟”,首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前,华为昇腾芯片已首先实现Step3的搭载和运行。沐曦、天数智芯和燧原等也已初步实现运行Step3。其它联盟厂商的适配工作正在开展。
相关攻略 更多
最新资讯 更多
阶跃星辰发布新一代基础大模型Step3,华为昇腾芯片已首先实现搭载
更新时间:2025-07-28
现在“最强”的AI模型,能不能替代医生门诊?一个AI产品经理的实际测试
更新时间:2025-07-28
吸金30亿+,具身智能“卷”向灵巧手
更新时间:2025-07-28
国产机器人走向全球,智元拟进军海外市场
更新时间:2025-07-28
游船侧翻、交通事故?央视通报多起AI炮制假新闻
更新时间:2025-07-28
Meta百亿抢人内幕,清华学霸转行AGI拿千万年薪,教授校友看呆了
更新时间:2025-07-28
上交突破极限,端到端无人机高速避障,可微分物理实现
更新时间:2025-07-28
下载量暴跌80%,AI社交终于涨不动了
更新时间:2025-07-28
金山办公发布原生Office智能体WPS灵犀,用户只需通过自然语言即可完成文档创作
更新时间:2025-07-28
城市多灾种早期预警智能体“妈祖”走出国门,在35个国家和地区试用
更新时间:2025-07-28