关闭广告

北大-灵初发布具身VLA全面综述!一文看清VLA技术路线与未来趋势

机器之心Pro2025-07-25 12:00:017947人阅读



机器之心发布

机器之心编辑部

如今,GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。研究者开始探索如何将这种智能从数字世界延伸至物理空间,以实现具身智能。这其中最受关注的前沿方向之一,便是视觉 - 语言 - 动作模型(Vision-Language-Action Models,简称 VLA)。此类模型借助基础模型的通用能力与大规模学习范式,可以处理通用的视觉(Vision)与语言(Language)输入,并生成实时动作(Action),极大地赋能了机器人系统。

近两年来,VLA 相关研究爆发式增长,技术路线日新月异 —— 但这也造成了认知碎片化与理解上的困难。现有分类方法如 “大脑 - 小脑”、“快慢系统”、“分层 - 端到端” 等,直觉清晰但本质仍不明确。领域急需系统化的分析框架,以梳理研究现状,指明未来方向。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

丰田该对特朗普说谢谢

虎嗅APP 浏览 1737 07-26

几乎每晚输出数百架 俄军一周发射的无人机抵上过去一年

上观新闻 浏览 1731 07-16

约5.1亿平方公里的地球:卫星如何实现高效高清晰观测?

中国科普博览 浏览 247 08-19

标配升级 全新2025款星纪元ES售18.98万元起

网易汽车 浏览 249 05-20

湖人控股权将首次脱离巴斯家族 新老板是个"熟面孔"

北青网-北京青年报 浏览 8029 06-19

为降低中国依赖,日本研发无重稀土电机磁铁

观察者网 浏览 6698 07-25

加拿大新外长就任后首次访华 外交部回应

新京报政事儿 浏览 118 10-15

新ES8杀到30万元内!押注纯电大三排SUV市场,李斌:不用担心蔚来不赚钱

时代周报 浏览 174 09-22

李在明:韩国不能再走"安全靠美国、经济靠中国"路线

澎湃新闻 浏览 271 08-27

国外拿奖到手软,这部成年人“限制级”治愈动画,国内要上了

最爱酷影视 浏览 192 09-05

雷军向海外转出50亿美金?小米集团回应!

浙江之声 浏览 8702 08-09

重大重组,突然异动!发生了什么?

券商中国 浏览 197 09-09

聚焦AI、金融与全球合作,2025外滩大会在沪开幕

大象新闻 浏览 199 09-11

大五座大空间 福特探险者四驱穿越版30.98万上市

网易汽车 浏览 235 06-08

学者:欧盟遭遇历史上黑暗一天 特朗普"生吞"冯德莱恩

南风窗 浏览 8724 08-06

拐点已至:慢慢生长的蔚来,开始结果了

网易汽车 浏览 150 09-24

7岁男孩补课期间从14楼坠亡 母亲痛哭:42岁冒险生下他

极目新闻 浏览 3028 08-07

72年来首次 中国"最神秘军校"招录本科女学员

上观新闻 浏览 6511 07-26

左手王丽坤,右手花百万嫖娼,究竟怎么想的?

洞见青年 浏览 6742 07-24

美国"放行",中国反劝企业避用英伟达H20

网易科技报道 浏览 546 08-13

王馥荔没想到,丈夫离世后47岁的王骁为她争光

12三哥说史 浏览 7861 07-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11