关闭广告

华为发布AI推理新技术 将于今年9月正式开源

财联社2025-08-13 12:00:013830人阅读

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

尼科-帕斯:从小我的偶像就是梅西,我看了阿根廷国家队所有比赛

直播吧 浏览 301 08-12

渤海银行职业经理人副行长提前辞任,续聘不足一年

财经众议院 浏览 5780 07-26

沉默的荣耀众星发文告别,吴越真挚,余皑磊搞笑,于和伟看哭众人

娱乐圈笔娱君 浏览 79 10-22

特朗普:将考虑因铀浓缩问题再次轰炸伊朗

环球网资讯 浏览 4103 06-28

俄失事客机上有一名中国公民 飞机失事原因披露

上观新闻 浏览 7501 07-25

上百团队托举中国动画崛起梦想

浏览 3231 07-14

百余项科技成果集中转化 北邮未来通信研究院(成都)在蓉揭牌

封面新闻 浏览 2392 07-17

围巾,女人气质的延伸

Yuki女人故事 浏览 53 11-05

马伊琍不再隐瞒,自曝离婚真相,姚笛仅冰山一角

小椰的奶奶 浏览 262 08-26

媒体人:无论对手是谁 愿中国男篮下场比赛能放开手脚 打好硬仗

直播吧 浏览 6164 08-10

Galaxy S23系列手机用户反馈:升级One UI 7后,拍照质量明显下滑

IT之家 浏览 9387 07-22

关税战惨败特朗普施压34国对华加税 "出头鸟"来了

南权先生 浏览 227 09-18

燕翔:2025年7月份进出口数据点评:进出口持续走强

首席经济学家论坛 浏览 6772 08-10

人工智能创新发展的擂台期待更多青年“揭榜挂帅”

上观新闻 浏览 668 07-27

美关税持续冲击,日本7月出口创四年多最大跌幅

国际金融报 浏览 262 08-21

“非洲手机之王”,被华为起诉!

网易财经 浏览 10249 08-07

阿尔卡拉斯与辛纳:新二人转能持续多久?谁将率先实现全满贯?

网球之家 浏览 3225 07-15

西贝冷冻大黄鱼用X光去刺引争议 专家:可放心食用

极目新闻 浏览 200 10-02

当“中国表格之王”开始发力多维表格

硅星人 浏览 89 10-24

发改委:综合整治无序非理性竞争

新华社 浏览 206 09-11

电讯报:尤文也对杰克逊感兴趣,若能送走DV9他们将寻求签新前锋

直播吧 浏览 10283 07-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11