参考指南

机器之心发布

机器之心编辑部

如今，GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。研究者开始探索如何将这种智能从数字世界延伸至物理空间，以实现具身智能。这其中最受关注的前沿方向之一，便是视觉 - 语言 - 动作模型（Vision-Language-Action Models，简称 VLA）。此类模型借助基础模型的通用能力与大规模学习范式，可以处理通用的视觉（Vision）与语言（Language）输入，并生成实时动作（Action），极大地赋能了机器人系统。

近两年来，VLA 相关研究爆发式增长，技术路线日新月异 —— 但这也造成了认知碎片化与理解上的困难。现有分类方法如 “大脑 - 小脑”、“快慢系统”、“分层 - 端到端” 等，直觉清晰但本质仍不明确。领域急需系统化的分析框架，以梳理研究现状，指明未来方向。

北大-灵初发布具身VLA全面综述！一文看清VLA技术路线与未来趋势

米体：圣西罗...

女性更容易后...

“开衩裤”今...

以伊“口头停...

官方：罗马签...

Windsu...

女子买万元钻戒签下回购协议到期后店铺倒闭无法兑现

又一民营银行换帅，前任曾领衔掼蛋俱乐部

外国人将打火机带到机场隔离区事发机场：漏检

印度双响炮！坠机塌桥献礼”迪，摔出世界纪录

德转列5大联赛球队新援上赛季参与进球榜：利物浦新援101球第1

央视记者：德黑兰已经没有安全的地方了

大额企业贷，7天放款，年化率3.6%，全国可做！

走向衰老的警示信号：你注意到了吗？

正确防晒延缓皮肤衰老警惕6个防晒误区

xAI被曝施压员工在私人电脑上安装监控软件，一名员工因此出走

都在骂李小璐，怎么没人敢骂陈赫？

民生银行年薪377万副行长卸任，系两年多第8位干到退休的高管

＂红老头＂被刑拘，会传播艾滋么？

画面公布!以军指控哈马斯在加沙医院地下修地道

美报告：中美一旦冲突中国＂家门口＂美国人员很难幸存

本届世俱杯扑救次数前10：尤文门将迪格雷戈里奥27次扑救第一

被嘲“情商低”的刘亦菲，再与好友聚餐

地平线总裁陈黎明：高阶智能辅助驾驶的拐点已经到来，将会快速增长

潮汕大佬卖精密工厂，狂揽104亿

31岁护士被同居男友杀害父亲：女儿之前从没谈过对象

两轮车的“智能税”，到底谁在交？

甜馨再回应风波：不想让人评判妈妈，没有说爸爸

快收起你的“大妈装”，五十多岁女人夏天这样穿，时髦还减龄

业内人士谈大学生坠入浮选槽：极其罕见很少会走到那