文章来源:08ai导航网发布时间:2025-08-12 16:24:33
8月12日消息,今日,华为正式发布AI推理创新技术UCM(推理记忆数据管理器)。
据了解,作为一款以KVCache为中心的推理加速套件,UCM融合了多类型缓存加速算法工具,分级管理推理过程中产生的KVCache记忆数据,可扩大推理上下文窗口,实现高吞吐、低时延的推理体验,降低每Token推理成本。该技术已率先在中国银联“客户之声”“营销策划”“办公助手”三大业务场景中,开展智慧金融AI推理加速应用试点,并已取得成果。
华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有ShareEverything(共享架构)存储厂商和生态伙伴。
相关攻略 更多
最新资讯 更多
华为发布AI推理创新技术UCM:可实现高吞吐、低时延推理体验,计划9月开源
更新时间:2025-08-12
编程“学废”了?普渡毕业却只获烤肉店面试,美国IT失业创新高:AI面试成最大屈辱,网友怒称宁愿失业
更新时间:2025-08-12
伯恩斯坦谈北美机器人市场:从形态之争走向解决方案
更新时间:2025-08-12
奥特曼再回应用户吐槽,并宣布Plus用户GPT-5推理额度提至每周3000次
更新时间:2025-08-12
2025 WRC:3天主旨论坛,4张中国面孔,见证一个崛起的智造强国
更新时间:2025-08-12
AI“失意者”苹果,到了它的「诺基亚时刻」吗?
更新时间:2025-08-12
马斯克的大招来了,智驾智舱全部升级,承认超算芯片走进死胡同
更新时间:2025-08-12
GPT-5发威,逼得马斯克 “放大招”?
更新时间:2025-08-12
重新体验 GPT-5 后,我想它比 GPT-4o 更需要一场葬礼
更新时间:2025-08-12
被低估的AI语音,AI商业化的下一张船票已来
更新时间:2025-08-12