关闭广告

华为发布AI推理新技术 将于今年9月正式开源

财联社2025-08-13 12:00:014105人阅读

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

粉色换紫色,苹果 iPhone 17/17 Air 共 9 款配色曝光

IT之家 浏览 4158 07-12

中国选手单杆147排行榜:丁俊晖7次居首,傅家俊、张安达排二三位

直播吧 浏览 4002 07-30

伊朗袭击摩萨德总部

财联社 浏览 8059 06-18

北京105-74终结广东8连胜,曾凡博回归18分,徐杰伤退,萨姆纳35分

懂球帝 浏览 283 01-02

美军突袭抓获马杜罗 三个细节值得关注

上观新闻 浏览 264 01-05

上海市委原常委朱芝松被公诉 曾长期从事军品工作

极目新闻 浏览 337 11-12

美军两架B-52轰炸机接近委内瑞拉海岸

环球网资讯 浏览 290 11-07

伊姐周日热推:电视剧《我的山与海》;电视剧《在你灿烂的季节》......

伊周潮流 浏览 218 03-16

高管窃取28人存单款2.5亿 一名被害储户起诉涉事工行

红星新闻 浏览 2806 07-16

醒醒吧! “女干部”别硬演,满屏都是“嘟嘟唇”,内娱没人了吗

娱乐圈笔娱君 浏览 6172 07-08

抗战剧《归队》定档,胡军李乃文主演,幕后团队更是堪称豪华

最爱酷影视 浏览 488 08-21

卷首语|这届年轻人,全员渡劫奥德赛

时尚COSMO 浏览 122 05-06

《喜剧之王单口季2》首轮口碑出炉!观众打分和评价“一针见血”

娱乐圈笔娱君 浏览 804 07-12

山东舰抵港当晚 一男子涉嫌违规使用无人机航拍被拘

极目新闻 浏览 9665 07-05

技术+临床双向赋能成都脑机接口产业 迎来新机遇

封面新闻 浏览 148 04-22

7205家途虎“包围县城”

国际金融报 浏览 506 08-25

亚马尔和网红参加节目时说皇马偷窃还抱怨,皮克表示同意

懂球帝 浏览 356 10-24

意大利总理反对向乌克兰派遣军队:俄罗斯有130万士兵

上观新闻 浏览 1141 08-20

5439亿元蝉联首富,他刷新中国纪录!2026新财富500创富榜:500位上榜企业家总持股17万亿元,回到历史高点

新财富杂志 浏览 17 06-17

28岁中国留学生海外失联十几天 曾给家人发送信息

环球网资讯 浏览 252 02-02

TVB颁奖礼太节省!3个明星坐一台车,话筒都不够分,场面好简陋

萌神木木 浏览 230 01-05
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11