关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:01267人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

六旬女子做痔疮手术9天后突然去世 当地卫健委介入

极目新闻 浏览 183 12-23

港股苹果概念股上涨,比亚迪电子涨超5%

证券时报 浏览 6998 08-12

巴萨旧将:沙特俱乐部愿意3000万签费兰,并给球员3000万工资

懂球帝 浏览 5508 07-31

北大教授武侯祠办讲座疑因贬低诸葛亮延期 博物馆回应

上游新闻 浏览 3457 08-07

普京:调解乌克兰危机的基础是消除其成因

国际在线 浏览 453 08-17

惨烈!马刺三人遭遇伤病被逆转14分 文班亚马或休10天造黑七?

颜小白的篮球梦 浏览 41 04-22

记者:纽卡与塞斯科团队进行具体谈判,莱比锡要价8000万到1亿欧

直播吧 浏览 4034 07-26

中金黄金矿难致6死1伤 股价闪崩超8%

观察者网 浏览 6908 07-25

清华土木工程教授马智亮:通用大模型在建筑领域离实用差很远

南方都市报 浏览 417 08-23

对话倪海厦传承人,为什么说多数赛博中医会走不下去?

虎嗅APP 浏览 213 12-29

印度坠机事故幸存者为英国籍

界面新闻 浏览 1669 06-13

优必选展出五大人形机器人,首发自主换电补能方案 | WRC 2025

钛媒体APP 浏览 2183 08-11

英法德启动“快速恢复制裁”机制,伊朗谴责

环球网资讯 浏览 317 08-30

官方:帕斯获意甲8月最佳U23球员,对阵热那亚前将进行颁奖

直播吧 浏览 338 09-11

孙颖莎:石洵瑶具备绝对实力,决赛不论对阵谁都会是艰苦的比赛

直播吧 浏览 459 08-11

全运会男足:上海U20 3-2新疆U20,刘诚宇、蒯纪闻破门,李新翔绝杀

懂球帝 浏览 232 11-09

有纯电/增程 极狐全新阿尔法T5预售12.38万起

网易汽车 浏览 265 10-15

徐正源为何逼宫?媒体人:或已联系下家,他和崔康熙南基一不同

奥拜尔 浏览 928 07-18

消失8年,这T0级演员突然复出了

独立鱼 浏览 278 11-04

低血糖发作,太太太尴尬了!

网易健康 浏览 342 09-23

亏损超1.4亿?《浪浪人生》票房崩塌

靠谱电影君 浏览 299 10-01
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11