关闭广告

南洋理工、腾讯等机构联手突破:让AI像人一样"指点"图片中的东西

科技行者2025-11-11 00:00:0151人阅读


你有没有试过这样的体验:跟朋友聊天时,你想让他看看照片里的某个东西,但又不知道怎么准确描述它的位置?你可能会说"就是那个红色的杯子",朋友却问"哪个红色杯子?"这种沟通障碍在人工智能领域同样存在,而且更加复杂。

由南洋理工大学、腾讯微信视觉团队、新加坡科技研究局等多家知名机构组成的国际研究团队,最近在这个问题上取得了重要突破。他们的研究成果发表在了计算机视觉领域的顶级学术平台上,论文题目是"PATCH-AS-DECODABLE-TOKEN: TOWARDS UNIFIED MULTI-MODAL VISION TASKS IN MLLMS"(arXiv:2510.01954v1),感兴趣的读者可以通过这个编号查阅完整论文。

这项研究解决的核心问题可以用一个简单场景来理解:当你问AI"这张照片里有什么?"时,传统AI只能告诉你"有一只猫、一个杯子、一张桌子",但它无法像人一样直接"指出"这些东西的具体位置。更糟糕的是,当你要求AI找到"桌子上那个蓝色杯子"时,它往往会给出一串看起来很专业但实际上并不准确的数字坐标,比如"[245, 156, 378, 298]",普通人根本无法理解这些数字代表什么。

<
上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

智己汽车11月销量13,577台,连续三个月刷新历史纪录

网易汽车 浏览 26 12-02

3岁男孩跌入炭堆全身烧伤85%尚未脱险 家人发声

封面新闻 浏览 97 10-22

手机显示VIP标识:河北联通与华为在张北草原音乐节“秀肌肉”

IT之家 浏览 6815 07-31

把个体才华转化为产业合力,内容创作者们缘何青睐“V聚场”?

澎湃新闻 浏览 4172 07-14

东风柳汽总经理林长波再谈理想i8、乘龙卡车对撞:我们保留诉讼权

IT之家 浏览 268 08-23

高德推出扫街榜 用真实到店给传统美食榜单“挤水分”

新熵 浏览 191 09-10

中美博弈的本质:实体和虚拟经济的决战

睿知睿见 浏览 9562 07-13

奉子成婚?45岁董璇闪婚一个月后,自爆想要二胎

阿览 浏览 313 08-12

韩澳竞争激烈!双方都有望成为2026世界杯二档球队

直播吧 浏览 9976 07-29

2025:“税年”

智本社 浏览 5704 08-14

大爆发!京东出手!

中国基金报 浏览 9314 07-25

罗马诺:雷斯今日未出现在曼城阵容中,他即将租借加盟赫罗纳

直播吧 浏览 9586 08-06

马斯克宣布回归7x24小时工作状态 还要在工厂打地铺

财联社 浏览 10289 05-26

71岁成龙现身!从5块钱龙套到奥斯卡,他用伤痕换200亿票房

娱乐白名单 浏览 8400 07-26

德外长胡咧咧:中国在周边地区"进攻" 也影响我们

澎湃新闻 浏览 276 08-19

巴媒质问:忘恩负义的阿富汗是否正成为印度代理人

澎湃新闻 浏览 129 10-14

神舟二十号航天员圆满完成第四次出舱活动;特朗普批准华盛顿特区恢复死刑

上观新闻 浏览 167 09-26

上海一家餐厅半只鸡卖1999元 店方:食材还有鱼翅

极目新闻 浏览 282 08-25

重磅产品G7终上市,小鹏迎来关键之战

虎嗅APP 浏览 3485 07-06

水利部针对北京启动洪水防御Ⅳ级应急响应

界面新闻 浏览 9297 07-28

"30亿私募跑路"细节公布 嫌犯叫嚣"有本事定我的罪"

红星资本局 浏览 204 10-01
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11