关闭广告

华为发布AI推理新技术 将于今年9月正式开源

财联社2025-08-13 12:00:014008人阅读

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

章子怡晒照为女儿醒醒庆生!

韩小娱 浏览 118 12-29

官方:原海港、深足康复师克雷顿加盟广州豹,能用汉语沟通

懂球帝 浏览 146 02-04

三场发布会、N款新车,长安汽车在慕尼黑车展上透露了什么信号?

高氏观市 浏览 354 09-11

搭华为乾崑ADS 4 猛士M817预售32.99万元起

网易汽车 浏览 8018 07-19

华为智能全家桶 传祺向往M8乾崑系列35.99万起

网易汽车 浏览 477 05-28

39岁热依扎硬演17岁少女,我竟然0秒就接受了

动物奇奇怪怪 浏览 326 09-20

外国企业对特定智能电视提起337调查申请

商务部网站 浏览 6740 08-06

投入数百亿!欧盟拟在AI赛道弯道超车

国际金融报 浏览 3540 07-31

卸任9年之后,招商银行又一原副行长被查

财经众议院 浏览 356 09-11

马斯克疑悄悄搁置"美国党"计划:或支持万斯2028竞选

红星新闻 浏览 536 08-21

RIO的“微醺”领地,突然站满了重量级玩家

深蓝财经 浏览 3817 07-13

重温两次"夜间模式"的震撼 九三阅兵演练画面百看不厌

人民网-人民日报 浏览 297 08-21

Manus清空微博及小红书账号,官网显示“在你所在地区不可用”

红星资本局 浏览 5932 07-12

全新丰田Hilux将于11月发布 提供GR运动版本

车质网 浏览 307 09-30

别再买“网红同款”了,显胖又低级!

Yuki女人故事 浏览 282 09-15

3秒级破百+820km续航,全新小鹏P7定义智能轿跑新标准

HiEV 浏览 7061 08-07

英特尔为《战地 6》公测和《四海兄弟:故乡》发布 101.6987 驱动

IT之家 浏览 3238 08-07

阿姨遛狗被狗绳拽入电梯井 多处内脏破裂

极目新闻 浏览 217 11-08

黄慧颐手撕保剑锋 曾黎意外卷入风波

第一娱记 浏览 174 01-16

香港大重置

巨潮WAVE 浏览 4740 08-13

海南上演追尾"神剧情" 酒驾司机撞的"受害者"也是酒驾

环球网资讯 浏览 177 01-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11