关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2026-01-29 00:00:01267人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

奇瑞全尺寸SUV内饰曝光 或将搭载混合动力

车质网 浏览 77 05-27

小城大事:郑德诚风波解除,李秋萍为空降镇长

少女的烦恼 浏览 294 01-12

美方公开核航弹测试画面

北京青年报 浏览 158 11-16

补时绝平,曼联终结各项赛事对阵热刺四连败

懂球帝 浏览 365 11-09

民警拦截冲卡轿车被顶行600余米摔至路面 仍昏迷不醒

潇湘晨报 浏览 1950 06-13

以军证实对伊朗核计划发动空袭:伊朗有足够的浓缩铀

财联社 浏览 6125 06-13

狩猎者连开数枪枪击老太:2次逃离后充当"好心人"送医

环球网资讯 浏览 564 08-19

小米召回超11.6万辆SU7标准版电动汽车 雷军发文

中新经纬 浏览 385 09-20

西媒:巴萨2019年违规接触格子,可能构成管理不善和账目造假罪

懂球帝 浏览 378 10-17

媒体:马克龙将承认巴勒斯坦国英国也发声 这非常难得

新民周刊 浏览 1513 07-27

53岁霍汶希带女儿拍大片,Hanni五官像混血儿

疯说时尚 浏览 7690 07-22

美国防部被曝暂停部分对欧洲军售 以保自身库存

环球网资讯 浏览 419 09-21

海牛6-7月最佳球员评选:兰克尔-泽、席尔瓦、尼古拉、金永浩

懂球帝 浏览 6972 07-30

提前揭秘:谷歌 Pixel 10 / Pro XL 手机营销渲染图曝光

IT之家 浏览 5147 08-07

今年秋天最流行“卡其色穿搭”,谁穿谁好看!

LinkFashion 浏览 373 10-14

老公狂亏150亿后,她出来挣钱还债了?

Yuki女人故事 浏览 10169 07-09

多家银行挂牌信用卡不良资产

中国基金报 浏览 329 11-25

武汉资本市场再迎新成员,禾元生物成功过会

虎投邦 浏览 9479 07-12

葡萄牙前国脚保莱塔:若热-科斯塔永远活在葡萄牙人的记忆里

懂球帝 浏览 9705 08-07

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者 浏览 293 01-13

全新宝马iX3将9月发布,2026年国产长轴版登场

新车评网 浏览 530 06-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11