关闭广告

行业首个:8B 参数面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型开源

IT之家2025-08-28 00:00:02238人阅读

IT之家 8 月 27 日消息,面壁智能 8 月 26 日宣布开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型,成为行业首个具备“高刷”视频理解能力的多模态模型。

MiniCPM-V 4.5 号称高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA,且性能超过 Qwen2.5-VL 72B,号称“最强端侧多模态模型”。


面壁智能介绍称,此前主流的多模态模型在处理视频理解任务中,因为平衡算力、功耗等因素,通常采取 1 fps 抽帧,即每秒只能截取 1 帧画面进行识别和理解。虽然一定程度上保证了模型推理效率,但也因此缺失了绝大部分视觉信息,降低了多模态大模型对动态世界「精细化」的理解。

MiniCPM-V 4.5 是行业首个具备高刷视频理解能力的多模态模型,通过将模型结构从 2D-Resampler 拓展为 3D-Resampler,进行三维视频片段的高密度压缩,在同等视觉 Token 量开销下的情况下,最大可接收 6 倍视频帧数量,达到 96 倍视觉压缩率,是同类模型的

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

靠“给血管做彩超”,这群“80后学霸”干出一个IPO!

野马财经 浏览 4770 07-17

ESG领跑者|对话英飞凌高级副总裁于代辉:如何以半导体技术撬动全球减碳未来?

澎湃新闻 浏览 237 08-25

潮汕大佬卖精密工厂,狂揽104亿

21财闻汇 浏览 8248 07-25

中国联通:首次实现云原生核心部件 100% 国产化

IT之家 浏览 3353 07-21

蒙特雷3-1逆转瓜达拉哈拉阿特拉斯

懂球帝 浏览 7738 07-27

2026 年度载人航天飞行任务标识开始征集

IT之家 浏览 71 11-01

韩国济州航空一客机冲出跑道 机上载183名乘客

环球网 浏览 1226 05-30

俄外交官给印度鼓劲:西方越批评 越证明你的正确性

澎湃新闻 浏览 327 08-21

微软盘后涨超8%,下季度资本支出计划超300亿美元

第一财经资讯 浏览 8257 07-31

男孩割包皮后睾丸坏死被切除 手术器材是医生临时买的

潇湘晨报 浏览 160 09-13

港女最爱的国产单品,赢了特斯拉?

新周刊 浏览 24 11-27

内塔尼亚胡:以色列将不得不做出"痛苦且重大"让步

环球网资讯 浏览 192 09-29

视界大会后台社交名利场!欧豪起身主动接杨幂,剧组之间互相抱团

萌神木木 浏览 55 11-04

上半年利润同比“腰斩” 全聚德关闭多家亏损门店

中国商报 浏览 3634 07-16

赫斯基:斯洛特应该调整战术体系,将萨拉赫撤出首发

懂球帝 浏览 88 10-23

美小盘股还有机会吗

国际金融报 浏览 271 08-21

朱媛媛离世5月后,辛柏青再传坏消息

乡野小珥 浏览 97 10-12

马斯克 Neuralink 10 月试验新脑机接口,助失语者“意念说话”

IT之家 浏览 153 09-20

奇瑞品牌大整合,成立“新四大”事业群

汽车公社 浏览 6503 07-08

蔚来四季度盈利的底气,到底是什么?

21世纪经济报道 浏览 79 10-25

4岁女孩在未锁门的车里睡觉突然失联 刑侦介入

极目新闻 浏览 82 10-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11