关闭广告

北大-灵初发布具身VLA全面综述!一文看清VLA技术路线与未来趋势

机器之心Pro2025-07-25 12:00:017944人阅读



机器之心发布

机器之心编辑部

如今,GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。研究者开始探索如何将这种智能从数字世界延伸至物理空间,以实现具身智能。这其中最受关注的前沿方向之一,便是视觉 - 语言 - 动作模型(Vision-Language-Action Models,简称 VLA)。此类模型借助基础模型的通用能力与大规模学习范式,可以处理通用的视觉(Vision)与语言(Language)输入,并生成实时动作(Action),极大地赋能了机器人系统。

近两年来,VLA 相关研究爆发式增长,技术路线日新月异 —— 但这也造成了认知碎片化与理解上的困难。现有分类方法如 “大脑 - 小脑”、“快慢系统”、“分层 - 端到端” 等,直觉清晰但本质仍不明确。领域急需系统化的分析框架,以梳理研究现状,指明未来方向。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

牛弹琴:法国又乱套了 乱得匪夷所思

现代快报 浏览 8832 07-22

直播吧中超最佳 卡扎:知道“经十路梅西”的梗,谢谢大家的夸奖

直播吧 浏览 203 09-10

微软 2025 年全新 Surface Pro 12 英寸体验:移动轻办公之选

IT之家 浏览 5509 08-09

“躺赚”的企查查,是个苦生意?

定焦One 浏览 117 10-13

上海一业主去美国探亲接到一通越洋电话:你家被淹了

看看新闻Knews 浏览 60 11-01

上海一家餐厅半只鸡卖1999元 店方:食材还有鱼翅

极目新闻 浏览 279 08-25

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻 浏览 100 10-22

泽连斯基:反对“用乌克兰领土交换和平”

澎湃新闻 浏览 9936 08-10

今年秋天最流行的外套,“短一点”才时髦!

LinkFashion 浏览 205 09-10

混动轿车标配四驱、激光雷达 技术普惠化时代来了

封面新闻 浏览 3436 07-06

10年状元!沃尔生涯11个赛季出战647场比赛 场均18.7分8.9助1.6断

直播吧 浏览 221 08-20

球场宣!洛杉矶FC主场大屏幕“官宣”:欢迎孙兴慜!洛杉矶FC前锋

直播吧 浏览 4885 08-06

踢球者:药厂已放弃引进佳夫,签阿克利乌什超出他们的预算

懂球帝 浏览 8715 08-07

城事|向“新”向“智”:AI数字化应用场景不断扩展

上观新闻 浏览 6574 07-26

长安集团重组已组建筹备组 预计8月落地

界面新闻 浏览 5695 07-09

一澳航波音客机突发紧急情况 降落后被救援车辆包围

界面新闻 浏览 133 09-27

专家:大罢免失败赖清德未必请辞 再投票民进党恐大乱

海峡导报社 浏览 1882 07-28

大疆、影石刺向彼此腹地:智能影像市场硝烟再起

蓝鲸新闻 浏览 9961 07-29

伊朗称以色列打不了长期战争 美媒:还能撑12天

看看新闻Knews 浏览 6213 06-19

顺为资本腾挪术:左手减持套现,右手押注新风口!

独角金融 浏览 169 09-11

别被销量和不断降价闪了眼,比亚迪的杀手锏,从来都只是“它”

小李车评李建红 浏览 257 08-18
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11