关闭广告

华为发布AI推理新技术 将于今年9月正式开源

财联社2025-08-13 12:00:014013人阅读

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

太空“4S店”要开张:Starfish验证“单眼”卫星交会PRO操作

IT之家 浏览 170 12-19

美媒称"中国威胁美国农民" 结果评论区大翻车

澎湃新闻 浏览 568 08-21

特朗普恢复美国防部旧称战争部计划 在美引发质疑

环球网资讯 浏览 383 09-06

解读世纪华通半年报:季度营收九连增,核心增长模式获充分验证

证券市场周刊 浏览 390 09-01

环球:中国实施稀土出口管制 美方没必要过度反应

环球网资讯 浏览 304 10-13

“退一步”是骗局:她们涌入山中,把世界越走越大

她刊 浏览 123 03-09

恭喜!乔治娜同意C罗求婚:我愿意,此生此世,生生世世

直播吧 浏览 583 08-12

年内最高浮盈超200% 公募参与定增项目八成“正收益”

证券时报 浏览 348 09-11

俄罗斯深夜不宣而战轰炸波兰使馆 波兰被打懵了

青青子衿 浏览 409 10-02

杭州20楼江景房业主破防:每晚耳边都是广场舞立体声

环球网资讯 浏览 101 04-10

2025款红旗H6正式上市 售价17.98-23.98万元

车质网 浏览 6325 06-28

大家都在重提安全 沃尔沃却选择沉默

网易汽车 浏览 6472 06-28

工业与人形机器人蓬勃发展 稀土需求有望迎来几何级增长

金证研 浏览 277 10-13

零跑业绩向好 朱江明持股增加

汽势传媒 浏览 255 10-21

今年冬天最美搭配:大衣+裙子,谁穿谁好看!

LinkFashion 浏览 192 01-12

茶颜悦色就手账本涉抄袭致歉:审核疏忽,确实存在部分未经授权的挪用

红星资本局 浏览 385 08-25

央视主持杨澜:嫁百亿身家老公,57岁却直播卖课

冷紫葉 浏览 241 10-19

湖南一地“天降多块不明物体” 当地:系卫星整流罩

极目新闻 浏览 10228 07-30

晕了晕了!科创50刚创近三年新高,机构就疯狂出逃,ETF份额竟跌至近一年新低

每经牛眼 浏览 406 08-23

陈奕迅公开承认有焦虑症 本人回应称不是很严重

鲁中晨报 浏览 441 08-15

6-0!6-0!斯瓦泰克送双蛋,首夺温网冠军,还解锁大满贯第100胜

侃球熊弟 浏览 5913 07-13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11