关闭广告

清华×生数研发国产视频具身基座模型Vidar,实现少样本泛化突破

网易科技报道2025-07-26 00:00:019079人阅读

7月25日,清华大学与生数科技联合发布模型。据介绍,作为视频大模型Vidu在智能领域延伸的重大突破,Vidar是全球首个基于通用视频大模型实现视频理解能力向物理决策系统性迁移的多视角具身模型。该模型创新性地构建了支持双臂协同任务的多视角视频预测框架,在保持SOTA性能的同时,展现出显著的少学习优势。

Vidar可在仅20分钟少样本训练下,泛化至全新机器人本体,完成多视角双臂操作任务,所需数据量约为行业领先的RDT的八十分之一,π0.5的一千两百分之一。相比以往依赖百万级动作数据的机器人控制模型,Vidar显著降低了数据门槛与训练成本。


该模型基于生数科技此前推出的视频大模型Vidu,在此基础上融入75万条双臂机器人具身数据,构建统一观测空间后进行预训练,并结合自动化动作采集与逆动力学解码器,实现从视频预测到动作控制的全链路闭环。

清华与生数科技团队还提出“任务无关动作数据”训练范式,通过ATARA方法自动采集机器人动作轨迹,仅需10小时,即可完成机器人动作空间泛化。配合高精度动作执行模型AnyPos,Vidar在实际任务中实现近100%成功率,精度远超当前行业基线33%

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

日首相石破茂被“逼宫”坚持留任:没考虑过执政到何时

红星新闻 浏览 1684 07-22

乐道L90内饰官图发布,7月10日全面到店并开启预售

皆电 浏览 3706 07-03

比不过刘亦菲杨幂,赵丽颖在电影圈处处尴尬

明月聊史 浏览 876 07-24

男子打妻子后发生关系被告强奸案将开庭 男方姐姐发声

潇湘晨报 浏览 2039 08-11

经常头痛、持续呕吐,要留心这类儿童肿瘤

网易健康 浏览 7545 06-03

瑞幸咖啡,没有对手?| 业绩狂飙

伯虎财经 浏览 511 08-11

推广|| 最近超喜欢的大包,好用到天天背!

黎贝卡的异想世界 浏览 351 09-13

上汽通用五菱2025年累销超163.5万辆 新能源年销首超百万

网易汽车 浏览 190 01-02

252名记者在加沙遇难 巴勒斯坦记者游行悼念

环球网资讯 浏览 306 10-09

和大衣哥儿子离婚4年后 陈亚男扬言要找条件更好的

手工制作阿歼 浏览 8012 07-24

60岁的妈妈夏天如何打扮?穿衣要不老气、不装嫩,得体又优雅

静儿时尚达人 浏览 2723 08-10

蓝军太难黑猫太黑!切尔西一周内两张脸

体坛周报 浏览 286 10-27

让大模型能自己想出安全方案——KAIST团队的突破性研究

科技行者 浏览 171 02-04

中老年女人穿对衣才优雅!试试这3个穿搭法则,不扮嫩不油腻

静儿时尚达人 浏览 202 01-08

东方港湾董事长但斌:致敬白酒投资者,这两年其他的人都吃香的喝辣的

红星资本局 浏览 182 12-24

皮尔斯:詹姆斯有着大前锋身材&后卫打法 他身材和大本一样

直播吧 浏览 387 08-21

美方或因中国购买俄石油对华征收次级关税 外交部回应

界面新闻 浏览 759 08-09

官方:伯恩茅斯门将保尔森租借加盟波兰俱乐部格但斯克莱希亚

懂球帝 浏览 399 08-26

微软豪掷79亿美元投资阿联酋AI企业G42,加速中东AI设施建设

IT之家 浏览 235 11-04

利瓦科维奇:我的偶像是卡西和布冯,我相信自己能很好地适应西甲

直播吧 浏览 362 09-11

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者 浏览 259 10-22
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11