关闭广告

清华×生数研发国产视频具身基座模型Vidar,实现少样本泛化突破

网易科技报道2025-07-26 00:00:019168人阅读

7月25日,清华大学与生数科技联合发布模型。据介绍,作为视频大模型Vidu在智能领域延伸的重大突破,Vidar是全球首个基于通用视频大模型实现视频理解能力向物理决策系统性迁移的多视角具身模型。该模型创新性地构建了支持双臂协同任务的多视角视频预测框架,在保持SOTA性能的同时,展现出显著的少学习优势。

Vidar可在仅20分钟少样本训练下,泛化至全新机器人本体,完成多视角双臂操作任务,所需数据量约为行业领先的RDT的八十分之一,π0.5的一千两百分之一。相比以往依赖百万级动作数据的机器人控制模型,Vidar显著降低了数据门槛与训练成本。


该模型基于生数科技此前推出的视频大模型Vidu,在此基础上融入75万条双臂机器人具身数据,构建统一观测空间后进行预训练,并结合自动化动作采集与逆动力学解码器,实现从视频预测到动作控制的全链路闭环。

清华与生数科技团队还提出“任务无关动作数据”训练范式,通过ATARA方法自动采集机器人动作轨迹,仅需10小时,即可完成机器人动作空间泛化。配合高精度动作执行模型AnyPos,Vidar在实际任务中实现近100%成功率,精度远超当前行业基线33%

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

志愿军"冷枪英雄":用206颗子弹杀敌203人 受金成日接见

极目新闻 浏览 379 10-26

周鸿祎:360最近都采购华为芯片,国产性价比高

南方都市报 浏览 8292 07-24

10岁女孩给浙江警方留下挑战书后失联:只给你们48小时

都市快报橙柿互动 浏览 435 09-11

31岁护士被同居男友杀害 父亲:女儿之前从没谈过对象

环球网资讯 浏览 2579 07-18

狂揽70亿挑战DeepSeek!AI创企被曝新融资,被英伟达押宝,团队大牛云集

智东西 浏览 3005 08-06

赫夫在西班牙球局大杀四方!哈利伯顿点评新队友:我嘞个豆

直播吧 浏览 7050 07-27

特朗普:战事不是挡箭牌 乌克兰该选举了

澎湃新闻 浏览 160 12-11

大众汽车将CARIAD降级,大象转身倒逼战略转向!

百姓评车 浏览 379 10-12

伊朗外长:伊朗给美国人"准备了许多惊喜"

界面新闻 浏览 215 03-11

记者:尼克斯一直在关注字母哥,因此暂缓了布里奇斯的续约

懂球帝 浏览 4226 07-17

渝超北碚队违规使用中乙球员,组委会:正在调查,将及时处理

懂球帝 浏览 374 10-20

"红老头"被刑拘,会传播艾滋么?

网易健康 浏览 3345 07-09

美ICE当街打死一人 施救医生:特工忙着数他身上的弹孔

红星新闻 浏览 263 01-27

公募二季度调仓路径曝光!增持股近九成上涨,39只涨超50%,冠军飙逾4倍

时代周报 浏览 9309 07-24

什么信号?有银行直接5.5折卖房

大猫财经Pro 浏览 229 11-11

卖电池比卖车还赚钱?宁德时代净利润超比亚迪、吉利

智选车 浏览 401 09-10

高性价比/中型纯电轿车 比亚迪e7官宣5月17日上市

网易汽车 浏览 539 05-15

官方:巴黎聘请德康为传播总监,她曾在巴黎奥组委工作

懂球帝 浏览 1860 07-30

性别争议选手未通过检测 越南U21女排世锦赛成绩取消

文汇报 浏览 674 08-14

白色灵动岛:消息称努比亚手机也将“上岛”,可自行选择开关

IT之家 浏览 265 12-21

纯电小型SUV还有激光雷达 长安启源Q05预计售11-13万

网易汽车 浏览 2280 08-08
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11