关闭广告

行业首个:8B 参数面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型开源

IT之家2025-08-28 00:00:02422人阅读

IT之家 8 月 27 日消息,面壁智能 8 月 26 日宣布开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型,成为行业首个具备“高刷”视频理解能力的多模态模型。

MiniCPM-V 4.5 号称高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA,且性能超过 Qwen2.5-VL 72B,号称“最强端侧多模态模型”。


面壁智能介绍称,此前主流的多模态模型在处理视频理解任务中,因为平衡算力、功耗等因素,通常采取 1 fps 抽帧,即每秒只能截取 1 帧画面进行识别和理解。虽然一定程度上保证了模型推理效率,但也因此缺失了绝大部分视觉信息,降低了多模态大模型对动态世界「精细化」的理解。

MiniCPM-V 4.5 是行业首个具备高刷视频理解能力的多模态模型,通过将模型结构从 2D-Resampler 拓展为 3D-Resampler,进行三维视频片段的高密度压缩,在同等视觉 Token 量开销下的情况下,最大可接收 6 倍视频帧数量,达到 96 倍视觉压缩率,是同类模型的

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

拖欠2000万投资款,知名影视公司紫骏影视被判“以房抵债”,实控人曹哲连带担责

红星资本局 浏览 186 02-05

夸克AI眼镜开售,88VIP叠加9折消费券,最低3329元

海外网 浏览 248 10-24

AI算力需求疯狂,微软“新云”交易额超600亿美元

华尔街见闻官方 浏览 221 11-05

半年净赚1亿元!周黑鸭,走出“至暗时刻”?

侃见财经 浏览 10494 07-24

全运会男足:上海U20 3-2新疆U20,刘诚宇、蒯纪闻破门,李新翔绝杀

懂球帝 浏览 232 11-09

从外观到内饰 福特烈马1966的完成度让改装显得多余

车之天下 浏览 277 09-30

午评:创业板指冲高回落涨0.55% 黄金概念股集体爆发

网易财经 浏览 396 09-01

拉科布声明未来2年所有人将在一起 这意味着勇士不引援了?

仰卧撑FTUer 浏览 277 10-18

BeingBeyond团队让30种机器人共享一个"大脑"

科技行者 浏览 174 01-28

《朝雪录》刚播热度破9000,口碑出炉,观众评价出奇的一致

娱乐圈笔娱君 浏览 2390 07-15

带着理想出发:理想汽车携手易烊千玺为时代青年发声

三言科技 浏览 305 09-29

谷歌电话会: 全栈AI战略驱动业务全面增长,每月Tokens处理量翻倍,视觉搜索增长70%

华尔街见闻官方 浏览 9593 07-25

记者:纽卡斯尔对佳夫感兴趣并已展开接触,但目前尚未正式报价

直播吧 浏览 8395 08-07

美国与欧盟达成15%税率关税协议

财联社 浏览 6555 07-28

法军总参谋长离任前警告:俄罗斯或在五年内进攻欧洲

每日经济新闻 浏览 10340 08-03

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道 浏览 5346 08-06

萨内蒂:国米曾尝试让萨穆埃尔加入教练团队;齐沃是完美人选

懂球帝 浏览 5024 08-07

爆亏60%?公募究极“倒霉蛋”

一地基毛 浏览 7950 07-13

宗馥莉被起诉,富二代们坐不住了?

恪守原则和底线 浏览 8434 07-20

雷军直播拆车,榜一大哥狂送“半辆SU7”

麦浪的玩车之家 浏览 199 01-06

国家喊你好好睡觉!6个知识点要牢记

人民网 浏览 971 03-28
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11