关闭广告

北大-灵初发布具身VLA全面综述!一文看清VLA技术路线与未来趋势

机器之心Pro2025-07-25 12:00:018189人阅读



机器之心发布

机器之心编辑部

如今,GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。研究者开始探索如何将这种智能从数字世界延伸至物理空间,以实现具身智能。这其中最受关注的前沿方向之一,便是视觉 - 语言 - 动作模型(Vision-Language-Action Models,简称 VLA)。此类模型借助基础模型的通用能力与大规模学习范式,可以处理通用的视觉(Vision)与语言(Language)输入,并生成实时动作(Action),极大地赋能了机器人系统。

近两年来,VLA 相关研究爆发式增长,技术路线日新月异 —— 但这也造成了认知碎片化与理解上的困难。现有分类方法如 “大脑 - 小脑”、“快慢系统”、“分层 - 端到端” 等,直觉清晰但本质仍不明确。领域急需系统化的分析框架,以梳理研究现状,指明未来方向。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

仅播2集就口碑大爆,收视率破1.2,这才是国产都市剧该有的样子!

娱乐圈笔娱君 浏览 345 10-18

趁换代前“捡漏”30万豪华中型SUV之选

网易汽车 浏览 402 09-16

环卫工翻垃圾找手表当事游客被传是法院干部 官方辟谣

纵览新闻 浏览 1492 07-15

魅族 StarV Snap AI 拍摄眼镜亮相,9 月 15 日发布

IT之家 浏览 445 09-09

Stein:小德里克-琼斯被仲裁要向前经纪人支付120万美元佣金

直播吧 浏览 344 09-11

宋佳、高圆圆、钟楚曦最近太美了!她们的穿搭普通人也可以借鉴

LinkFashion 浏览 6649 07-03

不是什么脸,都能被叫“高级脸”

时尚COSMO 浏览 367 09-10

美元崩盘超11%!全球资产迎来巨震!

米筐投资 浏览 910 07-11

起拍价618万 抗日将领李默庵故居以2913万落槌成交

封面新闻 浏览 637 08-12

正在谈判却收到30%关税信函 欧洲议会高官怒斥特朗普

每日经济新闻 浏览 5405 07-13

伊朗外长:美封锁港口是战争行为

环球网资讯 浏览 177 04-22

后生可畏!日本16岁少年100米跑到10秒整,打破世界U18最好成绩

直播吧 浏览 4266 07-27

印度向特朗普叫屈:土耳其也买俄油 美国怎么不罚

澎湃新闻 浏览 7267 08-06

NBA战报:雷霆94-91险胜掘金,沃特森15分

懂球帝 浏览 352 10-18

凌晨4点,超3万人现场观看!太火爆……

环球网资讯 浏览 298 01-18

哈马斯证实其军事领导人穆罕默德·辛瓦尔已死亡

极目新闻 浏览 441 08-31

妈妈为娃入学掏空480万买房结果悲催 上家说她记错了

新民晚报 浏览 1496 07-16

《生万物》观众最希望拿奖的人不是杨幂,而是不在海报上的迟蓬

萌神木木 浏览 385 08-27

牛弹琴:英国"动真格"了 王子被"大义灭亲"剥夺头衔

上游新闻 浏览 374 11-01

秋天的第一件外套:还得是冲锋衣

时尚COSMO 浏览 336 09-13

76岁他信再次服刑,家族能否翻盘?专家:女儿仍有机会参加泰国议会选举

时代周报 浏览 449 09-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11