关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:0179人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

足不出国享顶尖耳蜗 全球听力巨头落户博鳌乐城

看看新闻Knews 浏览 5399 07-12

西安通报"水管高空坠落砸中婴儿车":婴儿仍在救治中

极目新闻 浏览 5970 08-13

欧盟“暂停”报复性关税,但价值930亿欧元反制清单待命

国际金融报 浏览 2719 07-15

遵循“极简主义” 北京现代ELEXIO发布内饰官图

网易汽车 浏览 8438 07-09

记者:巴萨无法使用特狮80%的薪水空间为其他球员注册

懂球帝 浏览 3670 07-25

千亿航天玄鸟-R 火箭总体设计方案完成,计划明年首飞入轨 + 回收

IT之家 浏览 236 08-23

牛弹琴:韩国在美遭受奇耻大辱 韩国媒体集体破防

大象新闻 浏览 247 09-08

三句在低谷中给我力量的话

黎贝卡的异想世界 浏览 171 08-28

上海家化改革成效显著:上半年营收利润双增,发布业绩次日股价涨停

时代周报 浏览 229 08-25

巴基斯坦最新空军宣传片:歼-10CE占据大量镜头

上观新闻 浏览 172 09-09

赵露思回应小北脱口秀,一句“寄居蟹”成导火索,全网吵翻啦!

策略剖析 浏览 232 08-22

村庄挖出疑似乌木并被运走 当地:已追回一批正在鉴定

红星新闻 浏览 244 09-10

详解杨瀚森首秀3大亮点:比状元出色攻传防兼备 适应速度远超姚明

醉卧浮生 浏览 1472 07-13

英伟达市值一度破4万亿美元 人工智能成风口

浏览 3844 07-14

邦本宜裕:给自己本赛季表现打100分,本来想完成20个助攻

懂球帝 浏览 46 11-10

7小时票房仅2.9万,郭富城新片票房崩塌,成本超3000万,回本无望

靠谱电影君 浏览 258 08-22

足球报社长:我们曾想组织广州球迷探讨该不该抵制广州豹

懂球帝 浏览 309 08-11

正部"虎"齐扎拉被处理:搞"政绩工程" 对家属失管失教

南方都市报 浏览 9437 07-23

父母将589092元善款全额退还 患白血病儿子已上大学

环球网资讯 浏览 221 09-17

国新网:亚特兰大愿意为卢克曼打折,但固定费用需达到4500万欧

懂球帝 浏览 6532 07-30

媒体:一张照片传遍全网 特朗普与以总理上演"真人秀"

新民晚报 浏览 181 10-01
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11