关闭广告

北大-灵初发布具身VLA全面综述!一文看清VLA技术路线与未来趋势

机器之心Pro2025-07-25 12:00:018112人阅读



机器之心发布

机器之心编辑部

如今,GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。研究者开始探索如何将这种智能从数字世界延伸至物理空间,以实现具身智能。这其中最受关注的前沿方向之一,便是视觉 - 语言 - 动作模型(Vision-Language-Action Models,简称 VLA)。此类模型借助基础模型的通用能力与大规模学习范式,可以处理通用的视觉(Vision)与语言(Language)输入,并生成实时动作(Action),极大地赋能了机器人系统。

近两年来,VLA 相关研究爆发式增长,技术路线日新月异 —— 但这也造成了认知碎片化与理解上的困难。现有分类方法如 “大脑 - 小脑”、“快慢系统”、“分层 - 端到端” 等,直觉清晰但本质仍不明确。领域急需系统化的分析框架,以梳理研究现状,指明未来方向。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

高档酒卖不动,口子窖业绩失速,二季度营收近乎“腰斩”,“白酒一哥”侯昊缘何加仓?

时代周报 浏览 429 08-22

政策支持叠加出海增长 创新药产业引来系统性重估

金证研 浏览 8511 07-25

王一博,太狠了。

会说话的舌 浏览 1761 07-13

为什么最好全款买蔚来ES8,也不要贷款分期买?套路实在太多了

大志聊车 浏览 186 01-06

释永信被查:16岁出家 34岁出任少林寺方丈

上游新闻 浏览 5361 07-28

美以领导人就加沙教堂遭袭通话 以方发声明称“误击”

环球网资讯 浏览 914 07-18

动力升级 尺寸加长 吉利全新帝豪申报信息公布

网易汽车 浏览 369 09-11

仅自己可见:腾讯QQ群聊消息官宣支持元宝AI总结功能

IT之家 浏览 203 12-11

17.68万起!搭载全新图灵AI芯片 2026款小鹏G6/G9上市

网易汽车 浏览 196 01-09

离开组织部后,他变得客气了很多……

识局 浏览 9722 07-31

U19女篮世界杯:无张子宇中国爆冷遭尼日利亚逆转 冉珂嘉28+12

醉卧浮生 浏览 1217 07-13

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者 浏览 268 10-28

五旬老人带孩子,红雷叔和乃文叔都疯了。

伊周潮流 浏览 9391 08-09

特斯拉将在加州推出出租车服务,纯人工驾驶出租车

观察者网 浏览 5994 07-29

一汽丰田,断腕求生

电动势 浏览 7246 07-07

美军空袭尼日利亚 至少有4枚"战斧"疑未能引爆

环球网资讯 浏览 189 01-12

财经聚焦|新国标实施在即,电动自行车如何行好安全路?

新华社 浏览 3643 07-25

日本开始一项"史无前例"行动:派多架战斗机前往欧洲

枢密院十号 浏览 371 09-20

特朗普再被拍到手背涂抹遮瑕膏 白宫:淤青是握手所致

环球网资讯 浏览 3646 07-17

结束11年红魔生涯?太阳报独家:卢克-肖准备听取沙特球队报价

直播吧 浏览 947 07-25

卡拉格:曼城表现得很好,阿森纳会在英超冠军争夺中感到紧张

懂球帝 浏览 290 11-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11