关闭广告

华为发布AI推理新技术 将于今年9月正式开源

财联社2025-08-13 12:00:014101人阅读

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

卡瓦尼谈博卡杯赛被淘汰:我们创造了机会,但是没能破门得分

懂球帝 浏览 7222 07-24

机场回应航班起飞后返航:初步判断是机械故障导致

红星新闻 浏览 1194 06-16

2比4不敌张本智和 媒体:国乒不能只靠王楚钦独挑大梁

澎湃新闻 浏览 655 08-12

海皮亚:利物浦还需签下一名中后卫;弗林蓬与阿诺德各有特点

懂球帝 浏览 7175 07-29

阮奇龙庆祝冲超:美好的一个赛季,一起期待2026新的挑战

懂球帝 浏览 269 11-10

丰田全新四缸发动机轻松突破600马力,内燃机技术超越德国品牌!

郑谊 浏览 6406 07-02

年内房企高管超50次变动,“营销总”成调整焦点

北京商报 浏览 8663 08-11

长得不像MEGA了!理想i8上市:语音控制辅助驾驶,这思路很清奇

电车通 浏览 1749 07-30

米体:尤文对阵国米的比赛,将在意甲首次启用裁判视角摄像头转播

直播吧 浏览 423 09-10

72岁赵雅芝1588生日会门票秒没,网友:人傻钱多

港剧叔 浏览 372 10-19

欲破SpaceX垄断 "火神"火箭迎历史性发射

环球网资讯 浏览 19669 08-13

鲁内携手阿加西,丹麦新星的最后冲刺?

网球之家 浏览 6010 07-26

WAIC探馆:人形机器人在打 大模型厂商在卷

每日经济新闻 浏览 5827 07-27

内维尔:现在每次看切尔西比赛,都感觉他们输定了

懂球帝 浏览 140 04-22

太好看了!!!「镖人」把我看激动了!

吐槽电影院 浏览 239 02-24

库里致谢中国:每个时刻都是难忘的经历,我会久久珍藏于心

懂球帝 浏览 559 08-22

宝马iX3增9款涂装 国产长轴距版或年底上市

车质网 浏览 64 06-01

FIFA女足冠军杯:武汉女足首战奥克兰联,再胜一场将战阿森纳

懂球帝 浏览 512 08-21

加总理在中国说了美国最不爱听的话 2000亿协议拿到手

北回归线 浏览 328 01-18

科学家发现世界最大蜘蛛网 面积约106平方米

极目新闻 浏览 297 11-11

叙利亚过渡政府宣布延长停火15天

上观新闻 浏览 277 01-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11