关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2026-01-29 00:00:01268人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

赵震:中国青训最需要解决的是体系问题,应坚持搞校园足球

懂球帝 浏览 263 01-02

蔚来李斌:大三排纯电SUV时代到来,ES8累计销量9.3万辆

贝壳财经 浏览 490 08-22

惊呆!广州照明大王,四个创始人竟然公开内斗!

深蓝财经 浏览 6189 08-10

美团召开外卖行业恳谈会

第一财经资讯 浏览 7773 07-25

跟队:考虑到门迪的伤病,皇马很可能会拒绝放走弗兰-加西亚

懂球帝 浏览 3161 07-16

《树影迷宫》给10位演员演技排个名

皮皮电影 浏览 324 11-11

记者问批评球员是否担心更衣室反对,穆帅:你爸对你永远都很好?

懂球帝 浏览 291 11-25

上海举办沪港澳台侨青年无人机邀请赛

环球网资讯 浏览 3879 07-14

东方甄选2025财年总营收下滑三成,付费会员达26万

红星资本局 浏览 551 08-24

16个外甥一顿吃200个水饺 重庆"宇宙舅舅"发声

极目新闻 浏览 608 08-28

记者:米兰将以500万欧租借博尼费斯,附带2500万欧买断条款

懂球帝 浏览 483 08-22

销售渠道改为“单城单店”模式?丰田中国:仅少数地区试点|早报

汽车服务世界 浏览 311 10-24

李斌又搞到钱了!蔚来今年募资已超百亿

第一财经资讯 浏览 452 09-11

世预赛-英格兰5-0十人塞尔维亚 凯恩破门赖斯两助攻格伊传射建功

直播吧 浏览 431 09-10

尼科-帕斯9月8日度过21岁生日,阿根廷全队为他庆生

直播吧 浏览 460 09-09

万斯:照顾美国老年人比援助乌克兰重要

参考消息 浏览 263 12-23

盐湖提锂的高原神话

诗与星空 浏览 142 04-29

TVB女星刘佩玥被男粉摸臀!全场吓懵

橙星文娱 浏览 9540 07-26

外媒:特斯拉顶配Cybertruck价格进一步上涨

环球网资讯 浏览 464 09-01

天齐锂业半年报净利润8441万元扭亏为盈 有序推进产能扩张

证券市场周刊 浏览 440 09-01

韩网误认沈佳润为财阀千金 编造其父以名命城

陈意小可爱 浏览 520 08-12
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11