关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2026-01-29 00:00:01163人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中超第20轮观众人数:英博61611人居首,上海德比60031人排第2

懂球帝 浏览 9406 08-11

升至3477亿美元 伯克希尔一季度现金储备再创新高

澎湃新闻 浏览 1685 05-04

午评:创业板指半日跌3% 稀土永磁板块逆势爆发

网易财经 浏览 270 10-13

房东半年降价7次 中介砍价"大刀"仍未停

每日经济新闻 浏览 2890 07-26

湖媒坚信詹皇将在湖人退役!下季仍存冲冠曙光 暗示外界过度解读

颜小白的篮球梦 浏览 5484 07-28

经历家暴后离婚 50岁脱口秀新人"房主任":跟生活和解

扬子晚报 浏览 3802 07-14

获刑13年 司法部原副部长刘志强敛财4245万当庭认罪

政知新媒体 浏览 7440 07-23

不靠风口,靠“内功”:亿咖通的技术打法正在全球兑现

网易汽车 浏览 409 09-09

补时点射绝杀收获首球,穆勒社媒晒照:多么疯狂的比赛!

直播吧 浏览 414 08-25

张碧晨陷原唱风波 汪苏泷已给足体面 还是被打脸

联友军事 浏览 6140 07-29

德天空:莱比锡尚未收到谢什科报价,转会取决于伊萨克的去留

懂球帝 浏览 5404 07-28

被预言活不过6岁的少年考上浙江中医大 身上37枚钢钉

极目新闻 浏览 1779 07-29

瑞幸咖啡美国漂流记:拒收现金引争议、五年三换审计师

阿尔法工场 浏览 10454 08-07

11国将承认巴勒斯坦国之际 美国追加60亿美元对以军售

界面新闻 浏览 446 09-22

很轻松!队记:杨瀚森看起来玩得很开心 一直带着微笑

直播吧 浏览 8654 07-12

WAIC前线|傅利叶带来 GR-3 新品首秀 开启具身智能康养新概念

网易科技报道 浏览 9088 07-27

科学家发现拖网捕捞和气候变暖加剧海洋中汞释放风险

新华社 浏览 303 10-02

60岁阿姨靠穿搭火了!“简约款”穿出高级感,自然老去也很美

静儿时尚达人 浏览 283 10-12

日本开年密集外交搞了不少小动作 引发地区国家警惕

澎湃新闻 浏览 199 01-20

邮报:水晶宫上诉至国际体育仲裁法庭,8月11日公布裁决结果

直播吧 浏览 7271 07-31

有可能回家乡为老鹰打球吗?杰伦-布朗:我奶奶很希望 谁说得准呢

直播吧 浏览 318 09-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11