关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:01365人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

五菱缤果S开启预售 预售价6.88万元起

车质网 浏览 480 08-25

极具科技感 保时捷纯电Cayenne最新谍照曝光

车质网 浏览 521 06-13

六年了,我才理解郑秀文

江湖人称艾掌门 浏览 10295 08-09

秦岭失联10余天驴友被找到瘦几十斤 失联前后照片披露

极目新闻 浏览 3571 08-13

马斯克对全球宅男下手:AI女友谈恋爱 讲话"少儿不宜"

每日经济新闻 浏览 4818 07-17

英伟达GTC大会利好兑现?CPO板块大跌

财闻 浏览 211 03-17

泰国代理总理发声:柬埔寨没有表现出诚意

财联社 浏览 4339 07-29

中年女人的开挂指南,避开花衣服和紧身衣,把优雅感焊在身上

静儿时尚达人 浏览 361 11-16

首款星闪音频耳机!华为FreeBuds Pro 5悦彰耳机开售:1499元 母带级无损音质

快科技 浏览 242 11-25

上了年纪的女人,千万别盲目跟风模仿,这些穿衣思路实用优雅

静儿时尚达人 浏览 7940 07-18

伊利股份率先企稳 原奶拐点渐行渐近

证券市场周刊 浏览 432 09-11

榜妹热线 |王一博又被造谣?曾舜晞杀青后续?宋祖儿新剧无缝进组?代露娃资源飞升?哈妮克孜再演女二?

趣看热点 浏览 3077 07-15

迈阿密国际1-4不敌奥兰多城,马斯切拉诺:我负全部责任

懂球帝 浏览 590 08-11

限时补贴价9.28-10.98万 MG 4X正式上市

网易汽车 浏览 85 05-28

推广|| 她们新年状态大开挂?原来悄悄做了这笔“美丽投资”

黎贝卡的异想世界 浏览 257 01-06

6岁女童疑因左腿被回水管吸住溺亡:4个成年人未能拔出

澎湃新闻 浏览 4241 08-11

斯基拉:前米兰队长卡拉布里亚想回意甲,索要200万欧年薪

懂球帝 浏览 284 01-27

霍震霆与两儿子齐聚北京:父子同场见证是一种光荣

看看新闻Knews 浏览 441 09-03

美称对“占领”委内瑞拉保留选择权

南方都市报 浏览 209 01-06

E句话 | 晒同款炒饭曝光恋情?她火速辟谣

仙女事件簿 浏览 431 08-19

患者花费超14万手术 副主任医师把价值10万新器材扔了

重案组37号 浏览 245 02-04
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11