关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:01364人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

倾家荡产120万上星光大道,她如今怎样了

青橘罐头 浏览 362 10-21

不少老人宁愿挨冻也不敢开暖气,让人痛心!河北农村取暖问题,不能再耽搁了

每日经济新闻 浏览 291 01-06

法系纯电新旗舰,首次体验DS N°8,这设计你能接受吗?

ams车评网 浏览 8084 06-26

4月纯电动车销量TOP50出炉:Model Y下滑至第五名

智车情报局 浏览 546 05-27

踢球者:因价格分歧,勒沃库森未能签下尼斯右后卫克洛斯

懂球帝 浏览 484 08-26

“这顶帽子”太火了,今年流行的风格都离不开它

LinkFashion 浏览 179 12-28

曝那英老公疑似婚内出轨,与女子酒吧十指紧扣,女方主动举止暧昧

扒虾侃娱 浏览 493 09-10

中美外长刚谈完不到48小时 俄外长访华要来谈"大事"

掌青说历史 浏览 2139 07-14

东风奕派汪俊君:用大数据为产品、营销、服务赋能

网易汽车 浏览 409 09-13

黄仁勋身家超巴菲特 达1440亿美元位列全球第九

界面新闻 浏览 7202 07-13

以部长:已接回人质 必须重启战争打开加沙"地狱之门"

看看新闻Knews 浏览 351 10-22

追觅汽车赴德国选址建厂

大象新闻 浏览 479 09-11

五年间累计亏损超13亿,呷哺呷哺「不好吃了」?

节点财经 浏览 3386 08-07

白宫AI顾问焦虑:5年后,全球8成市场被中企占据,我们就输了

观察者网 浏览 5384 07-16

男子岷江溺水被两人接力救起 7岁时曾遇车祸死里逃生

红星新闻 浏览 9336 06-25

北青:各队实力参差不齐,U21联赛下赛季可能分级

懂球帝 浏览 509 08-23

快讯|国内首个垂类妇科大模型通过主任医师考试

网易科技报道 浏览 7905 07-30

消息称阿里本地生活推出外卖特价拼团“闪拼”,对标美团拼好饭

IT之家 浏览 513 08-22

光伏重大资产重组终止

21世纪经济报道 浏览 274 12-21

曼市的天空到底啥色?曼市双雄开赛3轮加起来共7分,下轮曼市德比

直播吧 浏览 416 09-01

火箭惨遭雷霆双杀!杜兰特23中7申京两双 亚历山大连续112场20+分

罗说NBA 浏览 280 01-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11