关闭广告

北大-灵初发布具身VLA全面综述!一文看清VLA技术路线与未来趋势

机器之心Pro2025-07-25 12:00:017527人阅读



机器之心发布

机器之心编辑部

如今,GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。研究者开始探索如何将这种智能从数字世界延伸至物理空间,以实现具身智能。这其中最受关注的前沿方向之一,便是视觉 - 语言 - 动作模型(Vision-Language-Action Models,简称 VLA)。此类模型借助基础模型的通用能力与大规模学习范式,可以处理通用的视觉(Vision)与语言(Language)输入,并生成实时动作(Action),极大地赋能了机器人系统。

近两年来,VLA 相关研究爆发式增长,技术路线日新月异 —— 但这也造成了认知碎片化与理解上的困难。现有分类方法如 “大脑 - 小脑”、“快慢系统”、“分层 - 端到端” 等,直觉清晰但本质仍不明确。领域急需系统化的分析框架,以梳理研究现状,指明未来方向。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

释永信10年前就被举报和女法师通奸 女方是母亲外甥女

恪守原则和底线 浏览 4153 07-28

E句话|75岁还公开征婚?

仙女事件簿 浏览 4134 07-22

澎湃思想周报|当AI开始“反犹”;注意力经济在吞噬Z世代

澎湃新闻 浏览 8191 07-14

乐道汽车:L90 配备来自蔚来十年技术累积的 4D 舒适领航功能

IT之家 浏览 1995 07-13

得了口腔黏膜病,真的会传染么?

网易健康 浏览 6307 04-18

50岁林志颖现状:变化大不敢认 鼻子圆润撞脸苏醒

小张帅 浏览 1084 07-24

感觉生活停滞不前的时候,试试这5个小方法获得能量

黎贝卡的异想世界 浏览 5134 06-26

辟谣!“酱油生虫”不要再怪酱油了

斑马消费 浏览 2308 07-12

软件服务故障致“星链”网络中断2.5小时

环球网资讯 浏览 7183 07-25

北京多所高校被指禁用罗马仕牌充电宝 公司发声明回应

红星新闻 浏览 2955 06-15

不见特斯拉跟风国产?Model YL以六座SUV身份入局

道哥说车 浏览 1882 07-18

Manus 清空国内多平台账号,前员工透露“不会继续推进”中文版

IT之家 浏览 2060 07-12

宁高宁:中国的房地产绝对没有到顶,北京平均房价和香港相比还差了两三倍

365财经plus 浏览 772 07-16

饿了么原CEO韩鎏被警方带走调查

界面新闻 浏览 719 06-21

春节过后,普京走了5步棋,招招绝妙

浏览 6120 07-14

40+中年女人,衣橱里不能少阔腿裤和过膝裙,藏肉效果特别好

静儿时尚达人 浏览 747 06-27

俄称打击乌军用机场 乌称袭击俄军事区

国际在线 浏览 1521 07-11

斯基拉:韦斯利预计明天与罗马签约,转会费2500万欧+奖金

懂球帝 浏览 7877 07-26

美国总统20年来首次造访美联储:手里拿着一本账

每日经济新闻 浏览 7312 07-27

消息称奇瑞墨甲人形机器人 9 月在国内开卖,面向普通消费者出售

IT之家 浏览 7246 07-12

大S墓碑曝光!环境布置很简陋,具俊晔太痴情

黄小仙的搞笑视频 浏览 9908 07-30
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11