关闭广告

北大-灵初发布具身VLA全面综述!一文看清VLA技术路线与未来趋势

机器之心Pro2025-07-25 12:00:018188人阅读



机器之心发布

机器之心编辑部

如今,GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。研究者开始探索如何将这种智能从数字世界延伸至物理空间,以实现具身智能。这其中最受关注的前沿方向之一,便是视觉 - 语言 - 动作模型(Vision-Language-Action Models,简称 VLA)。此类模型借助基础模型的通用能力与大规模学习范式,可以处理通用的视觉(Vision)与语言(Language)输入,并生成实时动作(Action),极大地赋能了机器人系统。

近两年来,VLA 相关研究爆发式增长,技术路线日新月异 —— 但这也造成了认知碎片化与理解上的困难。现有分类方法如 “大脑 - 小脑”、“快慢系统”、“分层 - 端到端” 等,直觉清晰但本质仍不明确。领域急需系统化的分析框架,以梳理研究现状,指明未来方向。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

釜山电影节红毯来了!孙艺珍一身粉裙像睡衣,Lisa礼服又透又贴身

萌神木木 浏览 412 09-18

疑因店员手指浸入面汤起争执 其子持刀冲向顾客被拦下

大风新闻 浏览 645 08-12

K2发布后,Kimi 研究员集体在X上搞起了“团建”

硅星人 浏览 4448 07-17

江祖平性侵案细节:施害者用镇静剂迷晕还偷拍,电视台紧急撇清

萌神木木 浏览 440 09-06

美国工厂不相信特朗普:关税推高成本,制造业连续4个月萎缩,工厂陷裁员潮

时代周报 浏览 8967 07-14

国产教育大模型亮相WAIC,这位“超级助手”让学生告别机械刷题

文汇报 浏览 10249 07-27

电动车充电桩价格突然暴涨100% 上海人直呼:用不起

环球网资讯 浏览 1120 07-29

淘宝闪购新工服需骑手自费购买?平台回应来了!

雷科技 浏览 329 11-06

王兴兴:让AI干活领域还是荒漠阶段 AI时代是非常公平的时代

网易科技报道 浏览 434 09-11

英国诞生8名"三亲婴儿",用0.1%的他人基因,告别致命遗传病

网易科技报道 浏览 4727 07-18

突发!688692,总经理被立案调查,留置!

证券时报网 浏览 491 08-20

美军被指6年前曾误杀朝鲜平民 特朗普:我啥都不知道

红星新闻 浏览 521 09-07

东风风神L8开启预售 定位混动SUV 预售价12.99万元起

环球网资讯 浏览 577 08-12

新世代宝马电车,能打翻身仗?

汽车头条APP 浏览 453 09-08

奥尼尔:KD入火真的能让特别的事发生 我们叫申京土耳其终结者

直播吧 浏览 457 09-11

特朗普:已开始从委石油资源中赚钱

环球时报国际 浏览 311 01-09

美媒:中美之间一个变化正在显现 欧盟总部相当纠结

环球时报国际 浏览 303 01-16

央视主持人再上新 已有多位"00后"

极目新闻 浏览 3122 06-15

GPT-5不够惊喜

北京商报 浏览 8143 08-11

德转:成都蓉城撤销艾比布拉报名,补报B队门将彭浩宸

懂球帝 浏览 4683 07-22

700公里托运"黄金下司犬"死在车上 狗主人索赔9000元

红星新闻 浏览 484 09-07
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11