关闭广告

清华×生数研发国产视频具身基座模型Vidar,实现少样本泛化突破

网易科技报道2025-07-26 00:00:019077人阅读

7月25日,清华大学与生数科技联合发布模型。据介绍,作为视频大模型Vidu在智能领域延伸的重大突破,Vidar是全球首个基于通用视频大模型实现视频理解能力向物理决策系统性迁移的多视角具身模型。该模型创新性地构建了支持双臂协同任务的多视角视频预测框架,在保持SOTA性能的同时,展现出显著的少学习优势。

Vidar可在仅20分钟少样本训练下,泛化至全新机器人本体,完成多视角双臂操作任务,所需数据量约为行业领先的RDT的八十分之一,π0.5的一千两百分之一。相比以往依赖百万级动作数据的机器人控制模型,Vidar显著降低了数据门槛与训练成本。


该模型基于生数科技此前推出的视频大模型Vidu,在此基础上融入75万条双臂机器人具身数据,构建统一观测空间后进行预训练,并结合自动化动作采集与逆动力学解码器,实现从视频预测到动作控制的全链路闭环。

清华与生数科技团队还提出“任务无关动作数据”训练范式,通过ATARA方法自动采集机器人动作轨迹,仅需10小时,即可完成机器人动作空间泛化。配合高精度动作执行模型AnyPos,Vidar在实际任务中实现近100%成功率,精度远超当前行业基线33%

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

券商三季度660亿持仓出炉!香农芯创等35股持股市值超3亿元!

私募排排网 浏览 215 11-06

被问是否会刺杀伊朗新领袖 特朗普突然"共情"了

极目新闻 浏览 132 03-11

何以“破卷”?光伏经历至暗时刻!

飞鲸投研 浏览 178 12-24

都体:西蒙尼亲自联系N-冈萨雷斯&罗马也有意,尤文要价3000万欧

直播吧 浏览 420 08-22

TVB颁奖礼红毯老龄化严重!50岁佘诗曼压轴,黄宗泽老到认不出

萌神木木 浏览 117 01-05

湖媒坚信詹皇将在湖人退役!下季仍存冲冠曙光 暗示外界过度解读

颜小白的篮球梦 浏览 5487 07-28

江俊晋级斯诺克苏格兰公开赛八强

体坛周报 浏览 175 12-19

女人过了50岁,建议多穿过膝裙和阔腿裤,才是真的优雅还藏肉

静儿时尚达人 浏览 2837 07-11

强掳马杜罗后 特朗普又"敲打"莫迪:让我高兴很重要

看看新闻Knews 浏览 212 01-06

000851,被重罚!9年财务造假近200亿元

第一财经资讯 浏览 5068 08-10

欧阳明高警示:中国车企转型需防范“欲速不达”

观察者网 浏览 112 03-17

美再向委周边调派装备和部队 专家:为发动攻击做准备

国际在线 浏览 196 12-17

越疆科技首席科学家郎需林:不比谁做得像人,比谁的机器人能更快走上岗位

红星资本局 浏览 6190 08-10

稳定币能否稳定仍待观察

经济日报 浏览 1565 07-28

A股重返3700点!券商后续行情如何演绎?

天下财道社 浏览 371 08-22

牛弹琴:特朗普现在很头疼 俄乌说一套做一套让他愤怒

大象新闻 浏览 535 08-23

这几双美鞋,让我的衣橱都“活”过来了

黎贝卡的异想世界 浏览 484 08-24

外媒:规模空前 大量美国军机正穿越大西洋

环球时报新闻 浏览 3491 06-17

低空航线的“红绿灯”长啥样?这家“小巨人”企业为低空飞行织就“安全网”

文汇报 浏览 6365 07-24

前意乙球员:皮耶罗踢意乙的时候,曾经在角球进攻中肘击我

懂球帝 浏览 353 09-26

航空公司“锁定座位”再引热议 律师评“有变相抬价嫌疑”

南方都市报 浏览 301 10-01
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11