关闭广告

北大-灵初发布具身VLA全面综述!一文看清VLA技术路线与未来趋势

机器之心Pro2025-07-25 12:00:018107人阅读



机器之心发布

机器之心编辑部

如今,GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。研究者开始探索如何将这种智能从数字世界延伸至物理空间,以实现具身智能。这其中最受关注的前沿方向之一,便是视觉 - 语言 - 动作模型(Vision-Language-Action Models,简称 VLA)。此类模型借助基础模型的通用能力与大规模学习范式,可以处理通用的视觉(Vision)与语言(Language)输入,并生成实时动作(Action),极大地赋能了机器人系统。

近两年来,VLA 相关研究爆发式增长,技术路线日新月异 —— 但这也造成了认知碎片化与理解上的困难。现有分类方法如 “大脑 - 小脑”、“快慢系统”、“分层 - 端到端” 等,直觉清晰但本质仍不明确。领域急需系统化的分析框架,以梳理研究现状,指明未来方向。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

约6000人被埋加沙废墟下 哈马斯:不会离开自己的土地

红星新闻 浏览 258 10-13

别克至境新车规划曝光 世家将于11月亮相

车质网 浏览 247 09-30

美乌欧会晤 特朗普政策立场被指发生重大潜在转变

环球网资讯 浏览 535 08-19

纯爽片,真用心,值得被更多人看见!

吐槽电影院 浏览 134 02-24

外媒:美对华威胁加税100% 极限施压报复北京近期举动

环球网资讯 浏览 279 10-13

5699 元起,华为 Pura 80 Pro / Pro + 手机京东优惠 800 元

IT之家 浏览 2439 07-12

华为联合打造全球首个 700MHz 8T8R 极简 5G 应急基站

IT之家 浏览 2969 07-17

再胜委内瑞拉通道采访!廖三宁强调防守,赵睿回应热身价值与磨合

篮球资讯达人 浏览 1758 07-26

字节跳动在内蒙古新设多家科技公司,注册资本合计28亿

财闻 浏览 137 02-24

郑中基离婚细节曝光:每月抚养费不够学费,身价5亿却如此算计?

娱乐白名单 浏览 5516 08-05

中方决定:不同捷克总统帕维尔进行任何交往

澎湃新闻 浏览 2863 08-13

再也不怕面瘫脸!YouTube黑科技:AI帮你「永久微笑」,连僵尸都咧嘴笑

新智元 浏览 371 09-09

空军航空开放活动和长春航空展交通指南来了

吉刻新闻 浏览 267 09-18

全球首次!万元相机置换OPPO Find X9 Pro:OPPO最高补贴1400元

快科技 浏览 273 10-17

每年火一个“红毯惊鸿一瞥”,今年轮到谁?

时尚COSMO 浏览 363 09-02

福建舰电磁弹射成功 媒体:至少有三件事令世界瞩目

大象新闻 浏览 395 09-26

甜馨否认内涵贾乃亮,指责大家过度解读,贾乃亮此前被曝已有二胎

萌神木木 浏览 2471 07-22

两位省委常委跨省履新 其中一人曾长期在中纪委工作

极目新闻 浏览 245 11-03

IU的脸,真的有自己的时间线

时尚COSMO 浏览 6 04-26

孙颖莎生日晒与父母合照,一家三口共用一张脸

观察鉴娱 浏览 242 11-05

“豪宅教父”黄其森被留置,千亿泰禾爆雷6年想上岸更难了

密探财经 浏览 415 08-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11