关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:01263人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

WTT美国大满贯国乒男线四人"一轮游" 赛场环境引吐槽

上观新闻 浏览 1769 07-09

德天空记者:德甲球队为莱斯特中场恩迪迪提供邀约,估价1500万欧

直播吧 浏览 2664 07-15

外媒:特朗普或于9月初访问北京 已联系美企高管陪同

环球网资讯 浏览 6676 07-12

窦骁何超莲不忍了合体发文,公开回应婚变

一娱三分地 浏览 244 10-25

特朗普媒体累计持有20亿美元比特币和相关资产,加密货币成主要财富来源

华尔街见闻官方 浏览 9677 07-22

马克龙不加入和平委员会 特朗普:加征关税他就会加入

界面新闻 浏览 220 01-21

古美关系高度紧张 古巴启动"战争状态"

扬子晚报 浏览 182 01-20

世上渣男千千万,最怕杨子这种

小嵩 浏览 442 08-17

摩根大通一线调研:微软领先所有人至少10光年,生态整合能力非常强大!

华尔街见闻官方 浏览 184 01-16

采用东风汽车平台 Jeep计划推出全新车型

车质网 浏览 257 10-17

50+姐姐的穿搭小心机:不装嫩不扮老,这样穿才显贵又舒服

静儿时尚达人 浏览 3094 06-23

中国新一代载人飞船"梦舟"零高度逃逸飞行试验成功

央视新闻客户端 浏览 10160 06-18

阿森纳官方:13名青训小将签订奖学金合同,为其举办签约仪式

懂球帝 浏览 4987 07-17

揭秘你意想不到的“光敏”食物

网易健康 浏览 9794 02-26

横滨胜王楚钦后立Flag!张本智和:目标是世界第一,因此不能休息

直播吧 浏览 1262 08-14

限时换新价11.98万 第三代蓝电E5 PLUS正式上市

网易汽车 浏览 192 12-04

卡萨诺:有九名球员不配在尤文踢球,戴维糟糕到令人难以直视

懂球帝 浏览 285 10-22

威格曼率队完成女足欧洲杯三连冠,成历史首位达此成就的教练

懂球帝 浏览 9456 07-28

独夫之心、上海小马哥、滤镜粉碎机、岷籽……他们都来了,要干什么大事?

上观新闻 浏览 9059 07-14

春天野菜不知不识莫乱吃

人民网 浏览 10031 06-03

男子被外卖车撞成十级伤残:小哥说"要超时送了再说"

封面新闻 浏览 530 08-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11