关闭广告

北大-灵初发布具身VLA全面综述!一文看清VLA技术路线与未来趋势

机器之心Pro2025-07-25 12:00:018187人阅读



机器之心发布

机器之心编辑部

如今,GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。研究者开始探索如何将这种智能从数字世界延伸至物理空间,以实现具身智能。这其中最受关注的前沿方向之一,便是视觉 - 语言 - 动作模型(Vision-Language-Action Models,简称 VLA)。此类模型借助基础模型的通用能力与大规模学习范式,可以处理通用的视觉(Vision)与语言(Language)输入,并生成实时动作(Action),极大地赋能了机器人系统。

近两年来,VLA 相关研究爆发式增长,技术路线日新月异 —— 但这也造成了认知碎片化与理解上的困难。现有分类方法如 “大脑 - 小脑”、“快慢系统”、“分层 - 端到端” 等,直觉清晰但本质仍不明确。领域急需系统化的分析框架,以梳理研究现状,指明未来方向。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

太阳报:桑托斯俱乐部将建造新球场,耗资9600万英镑有18层楼高

直播吧 浏览 527 08-20

专家:以色列攻击"禁区"卡塔尔 卡塔尔或倒向其他大国

红星新闻 浏览 840 09-11

深得阿杜真传?伊森上网怼空气:我场均24分钟12分只是运气好

直播吧 浏览 369 09-26

一年高速迭代、超2000万安装!鸿蒙版微信用实力回应质疑

雷科技 浏览 365 10-11

刘祝润首次中超单场传射建功,也是大连英博队史第三人

懂球帝 浏览 8939 07-28

电车销量涨不动?油车打响“销量保卫战”

少数派报告Report 浏览 308 12-14

工业设计软件逆势活跃 华大九天等创年内新高

第一财经资讯 浏览 357 10-13

遇暴雨 波兰一客机降落时冲出跑道

北青网-北京青年报 浏览 431 09-16

维持看涨!摩根大通预计金价明年底均价升至5055美元

第一财经资讯 浏览 355 10-24

至高省3万,奔驰品牌车型立享腾势全系车型置换补贴

网易汽车 浏览 556 08-16

演员李亭哲喊话和于朦胧一起喝酒的人:出来

恪守原则和底线 浏览 438 09-18

大爆发!京东,领投!

中国基金报 浏览 6496 07-21

立案调查背后 骑士乳业面临双重考验

铑财 浏览 1309 07-21

书记戴的AI眼镜全网刷屏!今年东博会这个含量“爆表”

国是直通车 浏览 448 09-22

今夏流行“不穿裤子”?显高显腿长,太撩了!

Yuki女人故事 浏览 7258 06-20

华为智能全家桶 传祺向往M8乾崑系列35.99万起

网易汽车 浏览 555 05-28

鸿蒙智行全年累计交付589107台 12月单月交付89611台

网易汽车 浏览 254 01-02

30岁孟子义再破天花板 她让整个内娱都“沉默了”

老吴教育课堂 浏览 366 09-01

朝鲜晚上举行盛大阅兵式 现场画面披露

央视新闻客户端 浏览 239 10-11

M3旅行版上市售94.39万元 告别平行进口

网易汽车 浏览 321 11-02

美媒披露:俄方要求乌克兰作出重大领土让步

鲁中晨报 浏览 4944 08-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11