关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2026-01-13 00:00:01308人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"俄院士"自称"苏辙后人"签下33亿大单 项目3年后流产

封面新闻 浏览 635 08-17

官方通报"女子误触氢氟酸身亡":氢氟酸系2015年遗弃

央视新闻 浏览 549 09-19

校外企业违规挪树致北语教授在清华被砸身亡 公司回应

极目新闻 浏览 9077 06-21

特朗普遭“背刺”,众议院未通过加密法案程序性投票

国际金融报 浏览 2681 07-17

奇瑞集团2月销售16.1万辆 累计出口突破600万辆

网易汽车 浏览 254 03-03

顺利康复!浓眉眼睛手术后首次进行5v5对抗训练

体坛周报 浏览 415 09-21

特朗普透露俄乌领导人会晤计划细节:已"大致安排好"

环球网资讯 浏览 601 08-20

音频实证日本有意滋扰中方训练

玉渊谭天 浏览 167 12-11

是福尔摩斯,也是列文虎克,智谱把OpenAI藏着的视觉推理能力开源了

机器之心Pro 浏览 8366 08-12

600200,连续4年财务造假!触及重大违法退市情形

第一财经资讯 浏览 3505 07-14

曝武切维奇或被公牛裁掉!湖媒称达菲可推动湖人签约 佩总又躺赢

颜小白的篮球梦 浏览 5653 07-28

媒体:赖清德越焦虑恐慌 两岸越要交流

环球时报国际 浏览 253 02-04

志愿军"冷枪英雄":用206颗子弹杀敌203人 受金成日接见

极目新闻 浏览 385 10-26

媒体:中美元首会晤让赖清德坐立不宁、寝食难安

环球时报新闻 浏览 318 11-01

"最强大脑"齐聚临港 上海正搭建未来科学共同体

看看新闻Knews 浏览 285 10-26

秋季上市 2026款大众ID. Cross谍照曝光

车质网 浏览 218 03-17

大V发博文质疑小米YU7耐力测试 再上热搜

网易汽车 浏览 1686 06-27

限时补贴价9.28-10.98万 MG 4X正式上市

网易汽车 浏览 85 05-28

惨!《脱缰者也》上映一天就被判死刑,网友给出的评论太解气了

娱乐圈笔娱君 浏览 505 08-26

曼晚:曼城不太可能安排第二场季前赛;罗德里预计周一报到

懂球帝 浏览 10508 07-25

导演文晏遭抵制!东京电影节撕奖不力,被批排挤华人女演员

萌神木木 浏览 259 11-06
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11