关闭广告

华为发布AI推理新技术 将于今年9月正式开源

财联社2025-08-13 12:00:014012人阅读

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

森林北近照曝光,五官不精致,没法跟章子怡比

娱乐小丸子 浏览 3218 07-14

育儿补贴来了!母婴股久违“回暖”

国际金融报 浏览 9604 07-30

谷圈的冷眼,是阅文IP失温的前兆

蓝鲸新闻 浏览 424 08-22

吨级无人飞行器首次完成海上平台物资运输

极目新闻 浏览 7055 08-03

一周AI大事:谷歌"P图神器"成新王,马斯克怒告前员工窃密跳槽

网易科技报道 浏览 403 09-01

他把黄渤捧红,自己落难时黄渤的做法让人钦佩

TVB的四小花 浏览 2031 07-25

七匹狼一年靠投资赚超3亿,男装不行投资来救该咋看?

江瀚视野 浏览 36 04-22

随队记者:伊萨克可能犯了最严重的错误,纽卡对他的声明感到困惑

直播吧 浏览 468 08-20

消息称苹果计划2026年底进军智能眼镜市场,重塑全球AR光学供应链

IT之家 浏览 157 02-03

以色列的新常态:创伤、分裂与集体错觉

澎湃新闻 浏览 321 10-08

港女最爱的国产单品,赢了特斯拉?

新周刊 浏览 211 11-27

创业者要做到“四个不要”

创业家 浏览 255 10-28

伊朗炮艇逼近悬挂美国旗油轮

CCTV国际时讯 浏览 181 02-05

苏丹总理呼吁相关国家及武装组织停止在苏丹部署雇佣兵

国际在线 浏览 448 08-17

罗志恒:特朗普“对等关税2.0”有哪些变化?为什么?影响几何?

首席经济学家论坛 浏览 7068 08-07

JPR:2025 年 Q2 全球客户端 CPU 出货量同比增长 13%

IT之家 浏览 4598 08-14

上海举办沪港澳台侨青年无人机邀请赛

环球网资讯 浏览 3775 07-14

未成年女性称被爱泼斯坦当"孵化器" 还遭公司高管强奸

红星新闻 浏览 207 02-05

欧文:我不会批评伊萨克,球员短暂的职业生涯中机会很难得

懂球帝 浏览 446 08-22

上海机场48岁总经理因个人原因辞职,上任仅9个月,去年年薪上百万元

红星资本局 浏览 271 10-26

亲属确认失联18岁女孩意外溺亡:被面包车拉走系谣言

南方都市报 浏览 4314 08-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11