关闭广告

即将开源!华为发布AI推理黑科技,已在中国银联落地

钛媒体APP2025-08-13 12:00:01536人阅读


图片系AI生成

8月12日,华为发布AI推理创新技术——UCM推理记忆数据管理器,旨在推动AI推理体验升级,提升推理性价比,加速AI商业正循环。同时,华为携手中国银联率先在金融典型场景开展UCM技术试点应用,并联合发布智慧金融AI推理加速方案应用成果。

UCM推理记忆数据管理器,包括对接不同引擎与算力的推理引擎插件(Connector)、支持多级KV Cache管理及加速算法的功能库(Accelerator)、高性能KV Cache存取适配器(Adapter)三大组件,通过推理框架、算力、存储三层协同,实现AI推理“更优体验、更低成本”。

AI推理:既不够快,也不够便宜

从行业视角观察,大模型的重心正在从训练转向推理。相关行业数据显示,当前推理算力需求已超过训练(58.5%)。GPT-5开放首周20 亿次/分钟,70%的请求为复杂任务推理(如代码生成、多步规划);而国内火山引擎的日均token调用量已达16.4万亿,其中70%以上来自线上推理而非训练。

与此同时,大模型行业总会频繁出现一个现象,一旦出现了一种火热

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

阅兵观礼名单公布 媒体:李在明错失与金正恩会面机会

看看新闻Knews 浏览 437 08-30

安踏还要继续追赶耐克|氪金·大消费

36氪财经 浏览 419 09-02

五十岁也优雅的女人,穿衣搭配不扮嫩和穿老年装,体面又时尚

静儿时尚达人 浏览 10031 07-22

银行股跳水!A股接下来怎么走?

国际金融报 浏览 6821 07-13

跨年晚会:王俊凯水中热舞 王嘉尔加入时代少年团

扒虾侃娱 浏览 271 01-01

东莞银行17年IPO长跑,能结束吗?

市值Observation 浏览 1183 07-16

红塔证券“限消”速撤背后

国际金融报 浏览 447 09-10

不愧是舒淇,好“生猛”的一部剧

时尚COSMO 浏览 380 10-14

哈格里夫斯:希望拉什福德能回曼联,俱乐部完全可以用得上他

懂球帝 浏览 344 01-06

谢娜因赶不上张杰演唱会,在车内大哭

韩小娱 浏览 5630 07-28

宗馥莉几乎搞砸了一切

功夫财经 浏览 338 10-14

Jacob Elordi 最新电影造型,好像鬼!

下水道男孩 浏览 351 10-26

国产英伟达之后,还有国产AMD!

诗与星空 浏览 7722 07-30

中国首条第8.6代AMOLED生产线量产,京东方投建

IT之家 浏览 10 06-17

美国就结束加沙冲突提出"20点计划"

央视新闻客户端 浏览 345 10-01

15岁道曼可出战新赛季英超,但已无缘打破恩瓦内里最年轻出场纪录

直播吧 浏览 9270 07-28

深蓝汽车房楠:四载深耕、技术破局、全球化竞争

网易汽车 浏览 137 04-29

年报收官 现金分红成估值重估重要变量

北京商报 浏览 126 05-06

苹果iOS 26 Beta 6泄密:AirPods将支持面对面实时翻译

快科技 浏览 2964 08-12

尴尬的是最后输了,狄龙回喷骂自己垃圾的热火球迷:看看比分,f**k

懂球帝 浏览 271 01-16

上海AI实验室发现"考试时间换智商"的神奇现象

科技行者 浏览 456 08-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11