关闭广告

华为发布AI推理新技术 将于今年9月正式开源

财联社2025-08-13 12:00:014106人阅读

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

星链再遇大规模网络中断 加剧系统可靠性担忧

财联社 浏览 536 08-19

伊朗前总统内贾德亲信称其平安

界面新闻 浏览 265 03-03

今年上半年,具备组合辅助驾驶功能的乘用车新车占比已提升至62.1%

财闻 浏览 469 09-09

50岁后还能健康工作多久?

澎湃新闻 浏览 1336 08-12

《理想足球运动员画像》:威廉·帕乔,低调、谦逊且令人印象深刻!2026年5月27日

绿茵情报局 浏览 78 05-28

科学家刊文称:发现影响癌症进展的关键细胞

新华社 浏览 287 01-23

职场“关系户”还值得羡慕吗?

识局 浏览 361 10-21

9月机票价格大跳水 国际机票现20元“骨折价”

新京报 浏览 447 09-16

此前宣布停止经营 靓家居发声致歉:公司发生重大变故

每日经济新闻 浏览 550 08-19

1300亿!中国啤酒大变局

华商韬略 浏览 579 08-19

给她的宇宙,Matthieu Blazy重塑香奈儿女性

时尚COSMO 浏览 300 10-08

特朗普“惊人比喻”俄乌冲突:这就是小孩打架

澎湃新闻 浏览 8012 06-07

百年老字号的资本挑战:携创收单品安宫牛黄丸,同仁堂医养四冲港股|港E声

时代周报 浏览 268 01-28

女人过了40岁穿衣要显贵!看看这些秋季穿搭,舒适又有气质

静儿时尚达人 浏览 347 10-25

万元损失仅补两千?国投瑞银的补偿,没能让大额投资者“和解”

拾盐士 浏览 230 03-03

定闹钟!4点半起床,杭州人有望目睹罕见“星星相吸”

都市快报橙柿互动 浏览 2908 08-10

女人钱是好赚!美图教父,花18亿香港买楼

说财猫 浏览 2073 08-14

保时捷再推一款“王炸车型”!内饰“四块”大屏,你受得了?

网上车市 浏览 7787 07-07

湖南慈利通报“网友反映因瓶装液化气销售价格引发矛盾、广告牌被损毁”:相关部门已介入调查

环球网资讯 浏览 366 10-14

照赫本这样穿,灰色很时髦!

Yuki女人故事 浏览 293 01-21

官方回应"孕妇遭两男子殴打住院":一打人者系公职人员

扬子晚报 浏览 1308 07-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11