关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:01367人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

Perplexity游说安卓手机预装!第三方AI应用抢占硬件入口?

雷科技 浏览 4850 07-29

吴倩张雨剑被曝复合!多次被偶遇还一起过年,网友吐槽女方想不开

萌神木木 浏览 7746 08-05

新一轮上升周期 券商盈利预期向好

证券市场周刊 浏览 523 08-20

菲澳加三国在南海联合军演 外交部:只会加剧局势紧张

财联社 浏览 491 09-06

阿里加入“百镜大战”!首款夸克 AI眼镜亮相,公司称“已完成研发,将于年内发布”

时代周报 浏览 6449 07-28

一个长城战略下,哈弗重塑命名体系

帮宁工作室 浏览 383 10-26

以色列再次延长对半岛电视台运营禁令

上观新闻 浏览 293 01-26

北京现代纯电SUV EO羿欧开启预售 13–15万元

网易汽车 浏览 374 10-17

黄圣依自曝初恋是贾乃亮!20年前北电校园恋情曝光

Yuki女人故事 浏览 9575 06-13

“TVB第一美人”背后,她到底赢在了哪?

Yuki女人故事 浏览 466 09-07

开学季,自闭症少年入学被拒

网易健康 浏览 480 09-10

2亿预定!阿森纳已花1.58亿欧宣5将,约克雷斯总价7350万即将体检

直播吧 浏览 8096 07-25

奥沙利文谈全年参赛计划:计划参加所有中国比赛,全年参赛约11站

直播吧 浏览 3876 07-28

1200亿元深耕中原!中国人寿助力河南区域经济高质量发展

证券市场周刊 浏览 294 11-04

尚筱菊在线各种吐槽,岳云鹏欧洲巡演该带他了

泠泠说史 浏览 453 09-21

5岁女童被废弃电线杆砸中身亡 父亲:已不通电20多年

大风新闻 浏览 464 09-17

苏州一餐馆3元糖水碗"内增高" 糖水覆盖碗底薄薄一层

扬子晚报 浏览 2627 07-17

置换抢购价9.99万元起 捷途X70L正式上市

网易汽车 浏览 374 09-27

上班族秋天穿什么?衬衫为主、外套选择基础款,得体又大方

静儿时尚达人 浏览 380 09-28

香港警方含泪通报:要让每一位遇难者都有名字

扬子晚报 浏览 366 12-02

丽江多弗度假酒店:古城深处的纳西文化秘境

商界 浏览 521 08-22
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11