关闭广告

南洋理工、腾讯等机构联手突破:让AI像人一样"指点"图片中的东西

科技行者2025-11-11 00:00:0150人阅读


你有没有试过这样的体验:跟朋友聊天时,你想让他看看照片里的某个东西,但又不知道怎么准确描述它的位置?你可能会说"就是那个红色的杯子",朋友却问"哪个红色杯子?"这种沟通障碍在人工智能领域同样存在,而且更加复杂。

由南洋理工大学、腾讯微信视觉团队、新加坡科技研究局等多家知名机构组成的国际研究团队,最近在这个问题上取得了重要突破。他们的研究成果发表在了计算机视觉领域的顶级学术平台上,论文题目是"PATCH-AS-DECODABLE-TOKEN: TOWARDS UNIFIED MULTI-MODAL VISION TASKS IN MLLMS"(arXiv:2510.01954v1),感兴趣的读者可以通过这个编号查阅完整论文。

这项研究解决的核心问题可以用一个简单场景来理解:当你问AI"这张照片里有什么?"时,传统AI只能告诉你"有一只猫、一个杯子、一张桌子",但它无法像人一样直接"指出"这些东西的具体位置。更糟糕的是,当你要求AI找到"桌子上那个蓝色杯子"时,它往往会给出一串看起来很专业但实际上并不准确的数字坐标,比如"[245, 156, 378, 298]",普通人根本无法理解这些数字代表什么。

<
上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

马斯克介绍SpaceX星舰计划:目标回收上级飞船、在轨加注燃料

IT之家 浏览 1484 07-28

价格落在30万级/四季度上市 方程豹钛7正式下线

网易汽车 浏览 5457 08-13

组千人团队,赴德国建厂!追觅跨界造车靠谱吗?

澎湃新闻 浏览 167 09-20

“首作之上”荣誉推选单元丨征片倒计时7天

幕味儿 浏览 265 08-21

乌媒称基辅上空出现一架神秘飞机 乌官方暂未回应

环球网资讯 浏览 2293 07-13

蔚来年底盈利:超越短期目标,重塑自己的竞争力

百姓评车 浏览 90 10-21

波兰总统:美国阻止波兰向乌克兰提供战机

新京报 浏览 8410 07-05

DeepSeek 向王一博道歉?知道真相后我乐了。

差评XPIN 浏览 3805 07-13

菲律宾前市长采购16台i7-11700电脑花17.5万美元,实际市场价仅7%

IT之家 浏览 228 09-01

来自世界人工智能大会的一线观察:“火爆”的智能体为何投资不温不火

文汇报 浏览 1914 07-28

ESPN:堪萨斯城曾接近签下C罗,但球员最终选择了利雅得胜利

直播吧 浏览 9616 08-13

拥有133年历史,张玉宁的老东家被逐出职业联赛

西北望看台 浏览 7183 08-13

熊园:9月财政有喜有忧,今年预算能完成吗?

首席经济学家论坛 浏览 96 10-20

李斌又搞到钱了!蔚来今年募资已超百亿

第一财经资讯 浏览 193 09-11

探访2025国际低空经济博览会:eVTOL适航进程加速,川企集体亮相

封面新闻 浏览 6746 07-24

官媒:中俄联合演习期间 一些国家的飞机舰船不断出现

政知新媒体 浏览 9007 08-06

世界首台,我国自动巡航杂交授粉智能育种机器人“吉儿”问世

IT之家 浏览 9796 08-12

三伏贴怎么贴才有效?这些事项要注意

人民网 浏览 8678 07-26

新世界纪录,我国铺设全球首条 7 芯光纤海底试验光缆

IT之家 浏览 218 09-10

程帅澎20分获MVP:轰5三分平约旦全队 三战46+10三分成头号射手

醉卧浮生 浏览 6322 08-10

新款宝马7系谍照曝光 或将于2026年正式发布

车质网 浏览 289 05-22
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11