关闭广告

清华×生数研发国产视频具身基座模型Vidar,实现少样本泛化突破

网易科技报道2025-07-26 00:00:018887人阅读

7月25日,清华大学与生数科技联合发布模型。据介绍,作为视频大模型Vidu在智能领域延伸的重大突破,Vidar是全球首个基于通用视频大模型实现视频理解能力向物理决策系统性迁移的多视角具身模型。该模型创新性地构建了支持双臂协同任务的多视角视频预测框架,在保持SOTA性能的同时,展现出显著的少学习优势。

Vidar可在仅20分钟少样本训练下,泛化至全新机器人本体,完成多视角双臂操作任务,所需数据量约为行业领先的RDT的八十分之一,π0.5的一千两百分之一。相比以往依赖百万级动作数据的机器人控制模型,Vidar显著降低了数据门槛与训练成本。


该模型基于生数科技此前推出的视频大模型Vidu,在此基础上融入75万条双臂机器人具身数据,构建统一观测空间后进行预训练,并结合自动化动作采集与逆动力学解码器,实现从视频预测到动作控制的全链路闭环。

清华与生数科技团队还提出“任务无关动作数据”训练范式,通过ATARA方法自动采集机器人动作轨迹,仅需10小时,即可完成机器人动作空间泛化。配合高精度动作执行模型AnyPos,Vidar在实际任务中实现近100%成功率,精度远超当前行业基线33%

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

哈梅内伊证实多人遇难称他们为"烈士":将严厉惩罚以

参考消息 浏览 8296 06-14

也算是开眼了!英国新能源车起不来,媒体将责任“划”给了小偷

小李车评李建红 浏览 81 10-23

轻松!王楚钦横扫张本智和,取得对阵张本智和的8连胜

直播吧 浏览 2694 07-14

一句话点评理想i系列:i8拉稀,i6就不拉稀!

少数派报告Report 浏览 152 10-01

媒体:过过打仗瘾 特朗普动用三艘驱逐舰打击贩毒集团

新民周刊 浏览 636 08-20

王菲辛苦养大李嫣,谁料竟便宜了李亚鹏?

策略剖析 浏览 323 08-12

富士通FMV Note A A77-K3笔记本:保留蓝光光驱,搭载AMD 7735U

IT之家 浏览 83 10-24

儿童是结核病高危人群,这11个问题家长要了解

网易健康 浏览 8909 03-24

全球不应遗忘:日本核污水排放的严峻警示

浏览 9032 07-14

科创板80后总经理被留置,去年年薪337万!董事长是A股最不服老的老板

深蓝财经 浏览 286 08-21

热度破5000!李行亮麦琳刚走,又来2大活宝,芒果台又出王炸综艺

娱乐圈笔娱君 浏览 101 10-17

李想的翻身仗:理想纯电第二枪

雪豹财经社 浏览 9687 07-30

电商蝴蝶公主:创造丑东西的小商家 更多的是做自己

封面新闻 浏览 3538 08-11

杭州联合银行2025年中期业绩透视:资产近6000亿大关,增长模式面临转型考验

Daily每日财报 浏览 285 08-20

卡塔尔"生气":以色列先道歉 我们再调解

澎湃新闻 浏览 147 09-22

多特官方:聚勒在对阵尤文时小腿肌肉受伤,将伤缺2个月

直播吧 浏览 319 08-12

替补绝平海港!35岁前国脚回怼营销号侮辱:我这废物又助队拿分了

我爱英超 浏览 5567 07-27

张碧晨:不止版权之争 5位顶流受牵连

一娱三分地 浏览 2073 07-29

聪明钱逆势买入2个亿!AI“倒车接人”了吗?

小白读财经 浏览 179 09-11

印乐法师的座驾比释永信的奥迪更"豪" 其更多猛料被扒

火山诗话 浏览 3123 07-31

抢不到票、退不了款,演唱会的锅该不该大麦背?

定焦One 浏览 310 08-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11