关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:0180人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

过度装修?美联储罕见发文否认:没有VIP餐厅、没有VIP电梯、没有新水景

华尔街见闻官方 浏览 3951 07-14

3艘美国军舰最快今日抵达 委内瑞拉全国征兵超450万人

每日经济新闻 浏览 2141 08-24

戏台:陈佩斯等了他8年,戏外娶初恋很深情

情感大头说说 浏览 7403 08-04

REDMI K90 Pro Max 可与 iPhone / 小米 17 Pro Max 通用钢化膜

IT之家 浏览 91 10-20

能买也能卖!利物浦已卖7人收入1.96亿欧,转会净投入回到亿元内

直播吧 浏览 2426 08-10

2025 款五菱星光 S 车型 8 月 15 日上市,可选 EV / PHEV 版本

IT之家 浏览 1998 08-09

美股大跌的导火索 MIT报告:95%企业从AI投资中获得0回报

华尔街见闻官方 浏览 280 08-20

奸臣就一定是坏人吗?

诗与星空 浏览 255 08-25

外媒称中方已要求中企停购英伟达芯片 外交部回应

环球网 浏览 164 09-19

剖析智元机器人:一场关于人才与资本的博弈

虎嗅APP 浏览 98 10-22

太潮了 苏-34飞行员“晒出”座舱里的Labubu

看看新闻Knews 浏览 260 08-25

行业“反内卷行动”首月,A股四大快递公司发布成绩单,3家单票收入仍下滑

红星资本局 浏览 167 09-21

特朗普:将与哈佛大学达成"令人难以置信的"协议

澎湃新闻 浏览 8958 06-22

暴涨1100亿!恒瑞医药,创新药“爆发”

侃见财经 浏览 9853 07-31

猫头鹰联手Prusa推出经典棕色、米色3D打印PLA耗材

IT之家 浏览 10 12-11

7月5日汽车行业日报

汽车圈大小事儿 浏览 6081 07-05

李亚鹏的女人缘为什么这么好?

仙女事件簿 浏览 110 10-16

财经聚焦|新国标实施在即,电动自行车如何行好安全路?

新华社 浏览 3484 07-25

TA:维阿在接受马赛体检,100万欧租借费+1400万欧强制买断

直播吧 浏览 1090 08-07

50+的女人,这才是你“反油腻”的穿衣关键:色不过3、衣不花

静儿时尚达人 浏览 1175 07-17

50岁女人衣不在多而在搭,学会穿长裤、长裙,美的优雅高级

静儿时尚达人 浏览 1912 06-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11