关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:01264人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

斯基拉:德温特在AC米兰的年薪为200万欧元

直播吧 浏览 3240 08-14

侯孝海离任 华润啤酒面临的新挑战

Daily每日财报 浏览 4365 07-17

梅开二度,姆伯莫当选与布莱顿一役曼联队内最佳球员

懂球帝 浏览 291 10-27

盲人因带导盲犬爬泰山被骂"虐狗":不想连累老板已辞职

新京报 浏览 384 10-01

“不仅是跟中国竞争电动车,如果输了,福特就没有未来”

观察者网 浏览 6178 07-22

男子在朋友圈诽谤局长被行拘:公安局撤销行政处罚

鲁中晨报 浏览 326 09-21

中东局势"历史性升级":美军轰炸伊朗3处核设施

澎湃新闻 浏览 1001 06-22

媒体:美伊互放狠话时白宫称愿谈判 让世界看到一信号

环球网资讯 浏览 170 02-03

广州多区发布暴雨橙色预警 白云机场延误率近4成

界面新闻 浏览 2534 08-07

姚笛疑似坐文章副驾?再回看当年

二月侃事 浏览 454 08-12

猛士M817上市,曹东杰:开发准则是坚持技术赋能体验

贝壳财经 浏览 409 08-19

无忧无虑自由球员西蒙斯更新社媒晒照:还在钓鱼

直播吧 浏览 1147 08-10

美股中概股集体大涨 蔚来涨超10%

证券时报 浏览 401 08-23

印度空军仅剩36架米格-21战机将全部退役

环球时报国际 浏览 332 09-23

美或要在"关系人类的事"上大反转 被指是"国家的耻辱"

环球时报国际 浏览 3953 07-27

印度砸7000亿卢比吸引日韩造船不料这两国胃口有点大

澎湃新闻 浏览 356 09-29

不莱梅队长与对手换球衣后穿在身上,记者误以为他是对方队长

懂球帝 浏览 405 08-24

涉违规挖湖造景等问题 河南追责问责210名党员干部

界面新闻 浏览 7794 06-15

雷克萨斯产品大变动 全新IS将于2026年亮相

车质网 浏览 10307 08-04

经纪人:我们从未和国米谈论过多纳鲁马,他们已经有门将了

直播吧 浏览 2935 07-15

三名中央委员职务有变动 均是“60后”

鲁中晨报 浏览 518 08-28
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11