文章来源:08ai导航网发布时间:2025-08-11 09:55:09
8月10日消息,据《科创板日报》报道,华为将于8月12日在2025金融AI推理应用落地与发展论坛上,发布AI推理领域的突破性技术成果。据透露,这项成果或能降低中国AI推理对HBM(高带宽内存)技术的依赖,提升国内AI大模型推理性能,完善中国AI推理生态的关键部分。
注意到,华为在AI推理领域的技术突破已有先例。2025年3月,北京大学联合华为发布了DeepSeek全栈开源推理方案,该方案基于北大自研SCOW算力平台系统和鹤思调度系统,整合了DeepSeek、openEuler、MindSpore与vLLM/RAY等社区开源组件,实现了华为昇腾上的DeepSeek高效推理。
在性能方面,华为昇腾已实现多项突破。例如CloudMatrix384超节点部署DeepSeekV3/R1时,在50ms时延约束下单卡Decode吞吐突破1920Tokens/s;Atlas800IA2推理服务器在100ms时延约束下单卡吞吐达到808Tokens/s。
科大讯飞与华为的合作也取得了显著成果,双方率先实现了国产算力上MoE模型的大规模跨节点专家并行集群推理,使推理吞吐提升3.2倍,端到端时延降低50%。
相关攻略 更多
消息称华为即将发布AI推理领域突破性成果:降低对HBM依赖,提升国内大模型性能
GPT-5问题太多,奥特曼带团回应一切,图表弄错是因「太累了」
代季峰陈天桥联手AGI首秀炸场!最强开源深度研究模型,GAIA测试82.4分超OpenAI
腾讯《虚环》《穿越火线:虹》公开实机演示;心动投资AI游戏公司;GPT-5可分钟级生成3D游戏 | 氪游周报8.4-8.10
红杉资本内部分享会:把握AI浪潮,开启万亿美元新机遇
秘塔AI,悄咪咪上线「今天学点啥」App
国产 AI 月活Top10全数下跌,可灵AI&Manus海外收入飙升!
专注轻办公场景,AR+AI眼镜品牌INAIR完成数千万元融资|涌现新项目
最新资讯 更多
消息称华为即将发布AI推理领域突破性成果:降低对HBM依赖,提升国内大模型性能
更新时间:2025-08-11
GPT-5问题太多,奥特曼带团回应一切,图表弄错是因「太累了」
更新时间:2025-08-11
代季峰陈天桥联手AGI首秀炸场!最强开源深度研究模型,GAIA测试82.4分超OpenAI
更新时间:2025-08-11
腾讯《虚环》《穿越火线:虹》公开实机演示;心动投资AI游戏公司;GPT-5可分钟级生成3D游戏 | 氪游周报8.4-8.10
更新时间:2025-08-11
红杉资本内部分享会:把握AI浪潮,开启万亿美元新机遇
更新时间:2025-08-11
秘塔AI,悄咪咪上线「今天学点啥」App
更新时间:2025-08-11
国产 AI 月活Top10全数下跌,可灵AI&Manus海外收入飙升!
更新时间:2025-08-11
专注轻办公场景,AR+AI眼镜品牌INAIR完成数千万元融资|涌现新项目
更新时间:2025-08-11
顶尖科学家RobFergus重掌FAIR,15万引用学者回归Meta,战略转向AGI
更新时间:2025-08-11
抱团取暖的日本AI半吊子们
更新时间:2025-08-11