关闭广告

清华×生数研发国产视频具身基座模型Vidar,实现少样本泛化突破

网易科技报道2025-07-26 00:00:018884人阅读

7月25日,清华大学与生数科技联合发布模型。据介绍,作为视频大模型Vidu在智能领域延伸的重大突破,Vidar是全球首个基于通用视频大模型实现视频理解能力向物理决策系统性迁移的多视角具身模型。该模型创新性地构建了支持双臂协同任务的多视角视频预测框架,在保持SOTA性能的同时,展现出显著的少学习优势。

Vidar可在仅20分钟少样本训练下,泛化至全新机器人本体,完成多视角双臂操作任务,所需数据量约为行业领先的RDT的八十分之一,π0.5的一千两百分之一。相比以往依赖百万级动作数据的机器人控制模型,Vidar显著降低了数据门槛与训练成本。


该模型基于生数科技此前推出的视频大模型Vidu,在此基础上融入75万条双臂机器人具身数据,构建统一观测空间后进行预训练,并结合自动化动作采集与逆动力学解码器,实现从视频预测到动作控制的全链路闭环。

清华与生数科技团队还提出“任务无关动作数据”训练范式,通过ATARA方法自动采集机器人动作轨迹,仅需10小时,即可完成机器人动作空间泛化。配合高精度动作执行模型AnyPos,Vidar在实际任务中实现近100%成功率,精度远超当前行业基线33%

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“双贴息”政策如何办理?官方指引来了!

21金融圈 浏览 2776 08-14

日本多地严重缺水 水稻产区面临“新米危机”

浏览 155375 09-26

中菲海警南海对峙48小时分出胜负 仁爱礁"破船"仍断粮

空天力量 浏览 283 09-02

网传鹿晗这么快解封,陈赫在其中起关键作用,在背后帮了他一把

七阿姨爱八卦 浏览 7987 07-09

笑不活了!网友集体冲进李亚鹏账号评论区,各种神评涌现太离谱!

娱乐圈笔娱君 浏览 151 10-16

田栩宁事件越闹越大!央妈下场回应 湖南台受牵连

TVB的四小花 浏览 8020 07-11

森保一:若球迷都穿巴西球衣来看球,那我们恐怕很难赢

懂球帝 浏览 97 10-14

赢下温网冠军对决!万卓索娃2-1莱巴金娜,2年后再进美网八强

全景体育V 浏览 226 09-01

开播冲上9.2分,这神剧又赢麻了

独立鱼 浏览 284 08-18

新华社深度解读:马斯克建“美国党”背后三大推手

澎湃新闻 浏览 3632 07-12

美国Q2实际GDP年化季环比初值3%好于预期

网易财经 浏览 6404 07-31

从点云到代码:上海人工智能实验室让3D建模像写程序一样简单

科技行者 浏览 203 09-10

曝楚铁男内幕交易,曾演《一起来看流星雨》,与董事长男友被刑拘

扒虾侃娱 浏览 193 09-10

世纪大和解?奥尼尔现场观战霍华德:我没有讨厌你只是激励你!

直播吧 浏览 284 08-19

多国强烈谴责以军袭击卡塔尔 特朗普表态并下达指示

每日经济新闻 浏览 250 09-10

独家对话美团王莆中:我们不想卷,但不能不反击

晚点LatePost 浏览 725 07-17

伊朗官员透漏美军轰炸核设施具体时间

CCTV国际时讯 浏览 10211 06-22

注意!九大行企业贷限时优惠,首年手续费减免,先到先得

闺蜜财经 浏览 488 07-28

如果你过了50岁,千万别穿“超短裙”,这样穿搭才高级和显瘦

静儿时尚达人 浏览 7290 06-17

小语种恐被AI时代边缘化?多国专家呼吁:语言模型不能只服务大语种!

第一财经资讯 浏览 7126 07-29

协议中加入"毒丸"条款 美国与印尼的贸易协议面临破裂

第一财经资讯 浏览 25 12-12
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11