关闭广告

即将开源!华为发布AI推理黑科技,已在中国银联落地

钛媒体APP2025-08-13 12:00:01286人阅读


图片系AI生成

8月12日,华为发布AI推理创新技术——UCM推理记忆数据管理器,旨在推动AI推理体验升级,提升推理性价比,加速AI商业正循环。同时,华为携手中国银联率先在金融典型场景开展UCM技术试点应用,并联合发布智慧金融AI推理加速方案应用成果。

UCM推理记忆数据管理器,包括对接不同引擎与算力的推理引擎插件(Connector)、支持多级KV Cache管理及加速算法的功能库(Accelerator)、高性能KV Cache存取适配器(Adapter)三大组件,通过推理框架、算力、存储三层协同,实现AI推理“更优体验、更低成本”。

AI推理:既不够快,也不够便宜

从行业视角观察,大模型的重心正在从训练转向推理。相关行业数据显示,当前推理算力需求已超过训练(58.5%)。GPT-5开放首周20 亿次/分钟,70%的请求为复杂任务推理(如代码生成、多步规划);而国内火山引擎的日均token调用量已达16.4万亿,其中70%以上来自线上推理而非训练。

与此同时,大模型行业总会频繁出现一个现象,一旦出现了一种火热

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

超800家A股公司中期分红,现在的中国股市真的不一样了

郭施亮 浏览 221 09-01

636分考生放弃985选福耀科技大学:父亲视曹德旺为偶像

潇湘晨报 浏览 2597 07-26

巴萨将发布国家德比特别版球衣,致敬2005年客场3-0战胜皇马

直播吧 浏览 1474 07-29

千亿航天玄鸟-R 火箭总体设计方案完成,计划明年首飞入轨 + 回收

IT之家 浏览 237 08-23

本月第2起 美客机急降约145米避免撞上军机

环球网资讯 浏览 706 07-28

全新丰田SUV上市!焕新价10.28万起 配2.0L混动

小史谈车 浏览 122 09-30

周鸿祎定义AI下半场:大模型只是“玩具”

态℃ 浏览 4388 08-07

百亿之后,珀莱雅失速

斑马消费 浏览 116 10-13

又有分析师称苹果iPhone 17美国售价或上涨,关税政策是主因

IT之家 浏览 9322 08-10

上半年售31.5万台,下滑超24%,本田在华终端销量出炉

车宇世界 浏览 4233 07-09

地平线总裁陈黎明:高阶智能辅助驾驶的拐点已经到来,将会快速增长

红星资本局 浏览 4281 07-12

‌耗资18亿,北美夺冠的大片,中国观众不买账,2天票房仅3550万

靠谱电影君 浏览 8088 07-13

今夏的小性感,看Camille Yolaine!

Yuki女人故事 浏览 1267 06-19

男子与发小介绍的女子"闪婚" 婚后发现女子是发小情人

红星新闻 浏览 4966 07-17

这届10后真会玩!以AI为笔,绘网络文明新图景

南方都市报 浏览 264 08-21

读懂IPO|北芯生命累亏超5亿元,第一大推广服务商0人参保,实控人以1元/股获8万股股权激励

时代周报 浏览 330 08-27

号称“能拍能打”,努比亚 Z80 Ultra 手机官宣 10 月 22 日发布

IT之家 浏览 122 10-11

FC26皇马球员内测能力值:姆巴佩&维尼修斯&贝林均为90

懂球帝 浏览 1482 07-30

AI盘前大利好!美国发布AI国策,谷歌上调资本开支,英伟达涨超2%

看财经show 浏览 8854 07-24

中国对俄罗斯试行免签 机票搜索量上升

看看新闻Knews 浏览 214 09-04

韵达空包诈骗案结果公布:总部被罚款4万

界面新闻 浏览 7544 06-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11