关闭广告

清华×生数研发国产视频具身基座模型Vidar,实现少样本泛化突破

网易科技报道2025-07-26 00:00:019166人阅读

7月25日,清华大学与生数科技联合发布模型。据介绍,作为视频大模型Vidu在智能领域延伸的重大突破,Vidar是全球首个基于通用视频大模型实现视频理解能力向物理决策系统性迁移的多视角具身模型。该模型创新性地构建了支持双臂协同任务的多视角视频预测框架,在保持SOTA性能的同时,展现出显著的少学习优势。

Vidar可在仅20分钟少样本训练下,泛化至全新机器人本体,完成多视角双臂操作任务,所需数据量约为行业领先的RDT的八十分之一,π0.5的一千两百分之一。相比以往依赖百万级动作数据的机器人控制模型,Vidar显著降低了数据门槛与训练成本。


该模型基于生数科技此前推出的视频大模型Vidu,在此基础上融入75万条双臂机器人具身数据,构建统一观测空间后进行预训练,并结合自动化动作采集与逆动力学解码器,实现从视频预测到动作控制的全链路闭环。

清华与生数科技团队还提出“任务无关动作数据”训练范式,通过ATARA方法自动采集机器人动作轨迹,仅需10小时,即可完成机器人动作空间泛化。配合高精度动作执行模型AnyPos,Vidar在实际任务中实现近100%成功率,精度远超当前行业基线33%

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

依旧神仙打架!沈腾吴京易烊千玺齐聚春节档

梦小娱 浏览 282 01-20

A股低价股数量锐减,当前牛市进入第几阶段?

郭施亮 浏览 9190 08-12

高分考生被厦门大学国外分校误录取:已有16人决定复读

极目新闻 浏览 5943 07-27

闫学晶风波再次升级,娱乐圈多位明星躺着中枪,唯独一人成为赢家

徐帮阳 浏览 264 01-18

芯片ETF爆发!沪指突破靠什么?

国际金融报 浏览 5570 08-13

吉利汽车集团10月销量307133辆 同比增长35%

网易汽车 浏览 247 11-03

不近视体质真的存在吗?

身体密码破译局 浏览 5285 06-11

天空体育:米兰未能说服霍伊伦接受他们提供的转会条件

懂球帝 浏览 538 08-21

11.99至15.99万元 长安启源A06开启预售

网易汽车 浏览 378 09-29

【产业互联网周报】 OpenAI推出GPT-5模型;OpenAI开源两款新模型;美国ITC正式对移动蜂窝通信设备启动337调查;阿里巴巴、腾讯开启2026届秋招

钛媒体APP 浏览 523 08-11

不一样的温子仁,最后时刻大反转!

电影最TOP 浏览 235 10-23

李迅雷:以旧换新——换什么乘数效应更大

首席经济学家论坛 浏览 3249 08-07

布莱克莫尔:曼联应签回德赫亚,当年滕哈赫赶走他是个错误

直播吧 浏览 907 07-18

00后试水A股,追热点、高活跃、爱炒科技股

21世纪经济报道 浏览 7258 08-10

王艺迪1-3不敌桥本帆乃香,无缘WTT瑞典站女单八强

懂球帝 浏览 432 08-22

Adobe Research突破:AI实现材质与物理特性视觉感知

科技行者 浏览 282 01-20

拉比奥母亲确认:德泽尔比告知拉比奥已不在计划中,要求离开

懂球帝 浏览 593 08-20

神二十乘组完成第四次出舱

极目新闻 浏览 367 09-27

七七火了!于正抢人!网友:周迅与张柏芝的合体

TVB的四小花 浏览 3465 07-16

价格是入门级X7两倍 宝马Alpina XB7新版本最新消息曝光

乐选爱车 浏览 201 03-16

拿下三项金扫帚奖,《红楼梦之金玉良缘》网络上线,烂的很彻底!

电和影 浏览 6070 07-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11