关闭广告

华为发布AI推理新技术 将于今年9月正式开源

财联社2025-08-13 12:00:014104人阅读

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

事实证明,“装过头”的吴京,已经活成第二个黄磊,反噬来了?

娱乐圈笔娱君 浏览 368 09-02

果然,51岁钟汉良还是赢了

温柔娱公子 浏览 195 12-11

特朗普专机着陆区附近发现"狩猎架" FBI证实介入调查

红星新闻 浏览 410 10-21

累计套现超400亿元!61岁富豪贝索斯大婚后减持,豪华婚礼耗资超3亿元

红星资本局 浏览 8758 07-28

全新深蓝S07亮相成都车展 超豪华越级更悦己

网易汽车 浏览 450 09-02

红色不流行了?今年最火的穿搭居然是它

LinkFashion 浏览 265 12-21

国乒全体弃赛!雨果&张本美和领衔出战巴西球星赛,总奖金215万

乒谈 浏览 5307 07-30

《余生有涯》张彬彬身材引关注,体型差异成焦点

麦芽是个小趴菜 浏览 375 10-18

水泥杆突然从底部断裂倒下 5岁女孩被砸中送医后去世

极目新闻 浏览 474 09-17

普京指挥俄军战略核力量综合演习

环球网资讯 浏览 322 10-23

Darling hold my hand,七夕礼物挑到疲倦

时尚COSMO 浏览 452 08-22

1晚房价3千 重庆一酒店称提供小熊猫叫早服务引争议

大风新闻 浏览 9278 06-19

詹字领衔扣篮队&杜库领衔射手队!美媒:七局四胜哪支球队能赢?

直播吧 浏览 409 08-12

临近年关,凤凰传奇高调官宣喜讯,网友:恭喜

阿废冷眼观察所 浏览 268 02-03

华晨宝马:宝思齐将出任总裁兼首席执行官

网易汽车 浏览 566 06-08

影视大佬吴敦离世,贾静雯林志颖发文悼念

素素娱乐 浏览 264 02-05

6岁女童练习"下腰"致截瘫 经营者曾因逃避执行被刑拘

红星新闻 浏览 270 01-02

金融数据回暖 社会资金流动性增强

金证研 浏览 2917 07-18

这次,郭麒麟也救不了乱成“一锅粥”的德云社

可乐谈情感 浏览 7359 08-08

小米米家空气净化器连续十年中国线上销量第一,出货量破2500万

IT之家 浏览 272 12-29

两大AI视频独角兽竞逐新融资!投前估值360亿、230亿

智东西 浏览 7433 08-07
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11