关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:01363人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

吉比特狂赚5.69亿!创始人卢竑岩分红独揽1.28亿!

包不同 浏览 257 11-01

捐出1亿元设基金培养优秀医生的刘进,再度入围工程院院士候选名单

澎湃新闻 浏览 497 08-22

特朗普修正行政令 美国将小额包裹关税税率降至54%

界面新闻 浏览 7102 05-14

世体:甘伯杯的基础门票已售罄,仅剩下500欧和600欧的VIP座位

直播吧 浏览 6191 08-07

阿森纳官方:13名青训小将签订奖学金合同,为其举办签约仪式

懂球帝 浏览 5054 07-17

美国官员:美国防部阻止乌使用远程导弹打击俄罗斯

大象新闻 浏览 520 08-25

2026品牌抢滩战:从野蛮生长,到“唯人格化”

霞光社 浏览 122 04-29

90岁罗兰拄拐送别周聪,被追问好友离世感受,网友怒斥港媒没良心

萌神木木 浏览 9931 07-24

足球报:女足亚冠抽签今天下午举行,卫冕冠军武汉女足分在第一档

直播吧 浏览 424 09-11

票房破19亿!漫威退下来3位演员,联手拍R级片,给老东家上了一课

皮皮电影 浏览 385 09-19

他是央视金牌主持人 57岁才结婚 娶了北师大教授

石场阿鑫 浏览 421 09-06

千问宣布投30亿元“发红包”,大厂竞逐春节档,腾讯元宝App一度崩溃

红星资本局 浏览 286 02-03

上纬新材尚未换骨

富凯财经 浏览 2114 07-13

李玟账号被异常登陆!最新解读

环球网资讯 浏览 283 10-12

入驻淘宝闪购日单量翻倍至8.5万单 切果NOW线下门店扩张至2000家

新熵 浏览 487 08-19

美航母将“被迫”减至10艘

环球时报国际 浏览 3891 07-09

布朗41+7+6绿军险胜双杀太阳 布克40+6迎500场20+里程碑

醉卧浮生 浏览 219 03-17

英伟达 N1x 跑分再曝:已在 Win11 上测试,使用 590 分支驱动

IT之家 浏览 10026 07-30

异构系统实现大模型推理加速与成本优化能力提升

科技行者 浏览 203 04-10

李小冉这种人最精了!

娱乐圈笔娱君 浏览 140 04-22

TA夸怀特、哲凯赖什和苏比门迪:各展所长,共同铸就关键胜利

懂球帝 浏览 303 01-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11