关闭广告

行业首个:8B 参数面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型开源

IT之家2025-08-28 00:00:02414人阅读

IT之家 8 月 27 日消息,面壁智能 8 月 26 日宣布开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型,成为行业首个具备“高刷”视频理解能力的多模态模型。

MiniCPM-V 4.5 号称高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA,且性能超过 Qwen2.5-VL 72B,号称“最强端侧多模态模型”。


面壁智能介绍称,此前主流的多模态模型在处理视频理解任务中,因为平衡算力、功耗等因素,通常采取 1 fps 抽帧,即每秒只能截取 1 帧画面进行识别和理解。虽然一定程度上保证了模型推理效率,但也因此缺失了绝大部分视觉信息,降低了多模态大模型对动态世界「精细化」的理解。

MiniCPM-V 4.5 是行业首个具备高刷视频理解能力的多模态模型,通过将模型结构从 2D-Resampler 拓展为 3D-Resampler,进行三维视频片段的高密度压缩,在同等视觉 Token 量开销下的情况下,最大可接收 6 倍视频帧数量,达到 96 倍视觉压缩率,是同类模型的

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

2024年结婚登记610.6万对

第一财经资讯 浏览 10466 07-31

联合国报告:仅35%的可持续发展目标细项进展顺利

浏览 64158 09-02

哥伦比亚一小型飞机在亚马孙地区坠毁 4人死亡

极目新闻 浏览 266 08-25

YouTube服务出现“宕机”:正在修复中

界面新闻 浏览 269 10-16

冒冷汗,它吓到我了...

越女事务所 浏览 4094 08-11

男篮欧锦赛-申京19+12+10 土耳其7人上双击败波兰杀入四强

直播吧 浏览 351 09-10

搭载华为智驾与座舱 岚图FREE+能否实现破局?

经济观察报 浏览 3508 07-13

撞脸刘亦菲网红曝做主播原因,工资低无法生活,深圳实习才两千多

扒虾侃娱 浏览 307 09-19

由于成都蓉城输球,德尔加多足协杯停赛将转移到联赛

懂球帝 浏览 419 08-20

巩俐和77岁“法拉利”老公甜蜜逛北京,依偎互拍

粵語经典歌單 浏览 205 12-15

中国男篮官宣裁掉2人:徐昕刘金雨离队 暂时还剩15人+仅两内线

醉卧浮生 浏览 7533 07-26

2万就能买套房的小城 要建机场了

中国新闻周刊 浏览 2416 07-09

今年“618”具身机器人销售额增长17倍!京东发布智能机器人产业加速计划

红星资本局 浏览 9192 08-10

卖盒饭成年轻人最新自救方式,有人刚够生活费,有人图情绪价值

每日人物 浏览 299 09-09

单依纯的活人感,如何呢

时尚COSMO 浏览 4772 06-09

长安抄底现代工厂,自主瓜分合资资产成新趋势

汽车公社 浏览 208 11-27

全球首款搭载华为乾崑智驾的燃油车来了

网易汽车 浏览 5597 08-02

酒旅业务升格,淘宝App新开“飞猪”入口;大疆发布首款扫地机器人 ROMO | 早资道

封面新闻 浏览 7313 08-07

一年涨60%+,这些小盘指数值得关注

炒基蛋 浏览 4982 07-31

达达「变身」,京东即时零售有了新阵脚

雷峰网 浏览 10146 07-31

起拍价3.9亿元!富力地产387处房产整体拍卖,较评估价打了八五折

红星资本局 浏览 4121 07-28
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11