关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:01265人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

抽检五个,两个不合格!桃李面包因菌落总数超标道歉

国际金融报 浏览 7840 07-31

成都经济运行数据出炉:新能源汽车产量增长326.2%

证券时报 浏览 437 08-22

王兴兴:宇树早些年发展比较慢,近几年给了再一次把握住AI时代的机会

澎湃新闻 浏览 371 09-11

售13.98万起 吉利新能源皮卡四驱山地版/高寒版同步上市

网易汽车 浏览 185 01-02

追觅天文正式官宣 构建“空天地一体化”生态

网易科技报道 浏览 364 09-11

大洋电机:重庆工厂将根据业务发展逐步释放产能

证券时报 浏览 2025 07-18

恰逢成都保卫战30周年,2025老甲A12月8日在成都双流开赛

懂球帝 浏览 217 11-12

日均不到1000元机器人带回家?智元为机器人租赁市场带来“令人心动的offer”

时代财经 浏览 255 10-31

“退一步”是骗局:她们涌入山中,把世界越走越大

她刊 浏览 123 03-09

媒体:"普特会"时长比预期缩短 释放多重信号信息量大

环球时报新闻 浏览 424 08-17

对话智元机器人王闯:直播收获大订单,出海已在路上

文汇报 浏览 5491 07-28

小米米家漫反射吸顶灯新品预约:1899元

IT之家 浏览 154 12-05

“不死鸟”上新!丰田Hilux完成换代,造型更硬核,启用纯电动力

闻车品百魅 浏览 135 02-19

歌手杨宗纬意外摔下2米高台后,发文首报平安

晴晴的娱乐日记 浏览 421 08-24

司晓迪隐藏聊天记录牵扯背后产业链!上不了热搜,一深扒就删帖

萌神木木 浏览 175 01-08

预售12.99万起!东风风神L8来了,“冰箱彩电大沙发”成亮点

电车通 浏览 480 08-12

日本网红当上议员 曾多次污蔑中国游客大喊"滚出日本"

上游新闻 浏览 7878 07-26

米切尔93&小莫布里89!骑士晒照:四大核心2K26能力值均在80+

直播吧 浏览 373 08-23

超千万元罚单屡见不鲜!第三方支付机构这些“坑”别再踩了

国际金融报 浏览 202 01-09

男子花46万"捡漏"特斯拉结果故障频出:9个月修不停

大风新闻 浏览 7859 08-11

收评:沪指13连阳再创十年新高 两市成交额突破2.8万亿

财联社 浏览 191 01-07
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11