关闭广告

华为发布AI推理新技术 将于今年9月正式开源

财联社2025-08-13 12:00:014107人阅读

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

联想 Legion Go 2 掌机被曝欧洲定价 999 欧元,9 月初上市

IT之家 浏览 510 09-01

双11|| 今年我只想回购这些!

黎贝卡的异想世界 浏览 377 10-18

老鹰124-112魔术豪取10连胜,沃克41分,杰伦约翰逊三双,班凯罗13中3

懂球帝 浏览 215 03-17

网恋1个月怀孕 45岁女子被61岁男友拉黑:他出轨别人

极目新闻 浏览 315 10-25

斯托伊科维奇:不会专人盯防凯恩;为什么不能赢下英格兰?

懂球帝 浏览 435 09-09

泰国总理:解散国会下议院不会影响泰柬边境局势

环球网资讯 浏览 283 12-13

小米电竞鼠标2官宣搭载专属原相全新旗舰传感器PAW3955XM

IT之家 浏览 117 05-06

女子花30元假装"上班" 有年入百万老板来"假装面试"

红星新闻 浏览 693 08-11

韩空难若被认定为飞行员失误 韩政府和波音公司将无赔偿责任

潇湘晨报 浏览 1708 07-24

郭晶晶婆婆的新身份,更让我羡慕了

Yuki女人故事 浏览 326 11-05

蚂蚁集团开发的超级机器人大脑:让机器人像人一样学会做任何事

科技行者 浏览 269 01-29

从IMO「抢跑」到AI「幻觉」:技术狂欢下的认知陷阱

深眸财经 浏览 7198 07-31

谁在豪赌具身智能?

定焦One 浏览 15 06-17

鹿晗关晓彤“小鹿甜筒”挂件暗藏甜蜜,暗戳戳秀恩爱,破分手传闻

娱圈百晓通 浏览 591 08-12

国庆期间境外旅游,警惕猴痘、登革热!

人民网 浏览 5233 10-01

亚冠综述:中超3队本轮1胜2平不败!蓉城升晋级区 申花海港淘汰区

我爱英超 浏览 408 10-02

“欺诈重整第一股”现形,股民被蒙在鼓里数月,证监会下最后通牒

壹只灰鸽子 浏览 286 12-29

驴友在秦岭失联遇难 公益救援队被家属起诉:心寒

红星新闻 浏览 552 09-20

韩国U23 4-2逆转黎巴嫩U23,姜成真、金泰元建功,文承旻破门

懂球帝 浏览 282 01-11

关注十四艺节 | 努力开拓闽剧发展新境界

时尚COSMO 浏览 415 10-02

中国刚买完美国玉米特朗普就立马变脸 摆了中方一道

策略述 浏览 294 11-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11