关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:01266人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

买下11栋房子,私下收学生隐蔽办学?扎克伯格遭邻居质疑,引来政府调查

红星新闻 浏览 1681 08-14

文班亚马:我真的不在乎个人荣誉,若拿到DPOY说明我帮到球队了

懂球帝 浏览 242 11-01

时隔六年进决赛!国安7-0十人玉昆将战河南 法比奥破门塞鸟两助

直播吧 浏览 425 08-21

特朗普政府酝酿关税B计划

北京商报 浏览 217 11-25

释永信被查背后,少林寺年入上亿,钱都去哪里了?

数字财经智库 浏览 877 07-28

金正恩将出席纪念活动 外交部回应

北京青年报 浏览 344 08-29

那英丈夫出轨对象疑似伪娘!脸型手臂符合男性特征,被嘲太会玩

萌神木木 浏览 313 09-11

黄紫昌:我相信拥有苏超这个赛事,江苏以后一定有顶级联赛球队

直播吧 浏览 405 09-01

智谱正式发布并开源混合思考模型GLM-4.7-Flash,供免费调用

财闻 浏览 191 01-21

卡内基梅隆大学团队揭秘:AI绘画无需人工标注也能学会"听话"

科技行者 浏览 266 10-31

主办94亿传销案警察受贿 将主犯带出到酒店与情人开房

封面新闻 浏览 6721 07-21

俄军在苏梅、库皮扬斯克、红军城三线突破

浏览 1771 07-14

纽约市长候选人称若当选将逮捕内塔尼亚胡 特朗普发声

澎湃新闻 浏览 4313 07-10

中国女足近11次对澳大利亚未尝胜绩,但在亚洲杯还没输过对方

懂球帝 浏览 110 03-17

可逐字复现畅销书,多家巨头AI模型被指存储版权作品

IT之家 浏览 141 02-24

许凯被带走配合调查?

八卦疯叔 浏览 351 09-10

文章恋情曝光后首现身,左手戴戒指疑似二婚,与绯闻女友多次同台

萌神木木 浏览 448 08-16

原来他们是爷俩,冷漠父子藏实力!低调逆袭

章眽八卦 浏览 301 10-16

陈思诚新片定档!五一档终于有救了

陈意小可爱 浏览 41 04-22

“军国主义”为何能在日本存续下来

国际在线 浏览 182 11-23

男子闪婚发现妻子隐瞒精神病史起诉 女方拒还13万彩礼

极目新闻 浏览 455 09-07
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11