关闭广告

华为发布AI推理新技术 将于今年9月正式开源

财联社2025-08-13 12:00:013832人阅读

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

收手吧何润东!不要再侮辱观众眼睛

诗意世界 浏览 1924 08-10

官方通报“小米汽车司机超车致4死当庭亮贫困证明”

澎湃新闻 浏览 313 08-20

"中原粮仓"经历罕见干旱 农民:贷款种地利息都还不上

新京报 浏览 10236 08-07

无法参选国民党主席 卢秀燕正式表态并亲自透露原因

海峡导报社 浏览 286 08-25

哥伦比亚媒体:利物浦、曼城、尤文关注29岁水晶宫后卫穆尼奥斯

直播吧 浏览 783 07-22

官方:布莱顿门将拉什沃思租借加盟英冠考文垂

懂球帝 浏览 861 07-25

曼联无缘德甲悍将恐不买新中场!桑乔热恋无心踢球,红魔催他快走

罗米的曼联博客 浏览 234 08-24

昆明一电梯冲顶致业主身亡:维保造假 3家公司15人涉案

澎湃新闻 浏览 4683 07-12

拥有三家工厂的被拐女孩见到亲生父母:下跪求讨公道

扬子晚报 浏览 8736 07-13

阅文集团,重走LABUBU“老路”

新消费101 浏览 893 07-17

25年前与普京合影的湖南小伙:在俄留学7年 希望再同框

三湘都市报 浏览 2460 08-13

伊朗向以色列发射高超音速导弹

CCTV国际时讯 浏览 2232 06-18

接近半数球队广东&辽宁&新疆&北京&山东等8队本次选秀未选人

直播吧 浏览 7676 07-26

黄仁勋:想对华销售新型特供芯片

观察者网 浏览 259 08-23

京东京造推出 10KG 家用变频热泵式烘干机,3099 元

IT之家 浏览 3437 07-24

“钢铁大亨”投资“口罩大王”,两个月浮盈近10亿

侃见财经 浏览 43 11-08

60万买的蔚来1年跑17万公里被取消终身质保 车主发声

扬子晚报 浏览 6030 07-23

浙江跟队怒批马宁:出牌动作夸张、人体扭曲,暴露其表现型人格

直播吧 浏览 141 09-21

“安我股保”假保险的真骗局 传销式推广暗藏陷阱

北京商报 浏览 29 11-27

神扑+关键扑点,王国明当选成都vs河南一战最佳球员

懂球帝 浏览 231 08-20

结束签换!勇士计划强留库明加就让他二选一:2年4500万/1年790万

直播吧 浏览 8932 07-31
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11