关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:01366人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中方代表在安理会谴责美国袭击伊朗

央视新闻客户端 浏览 7232 06-23

德天空:利物浦准备首次报价伊萨克,法鹰正等纽卡再报价埃基蒂克

直播吧 浏览 2439 07-16

以军被指用微软云服务大规模监控巴勒斯坦人 微软回应

环球网资讯 浏览 508 09-26

国庆狂销7套!中海大境实景示范区人气爆棚,热气球瞰湿地太震撼

智谷趋势 浏览 435 10-02

纯电CLA领衔,奔驰携28款车型亮相成都车展

观察者网 浏览 490 09-01

美航母连坠两机原因引猜测

环球网资讯 浏览 359 10-29

外媒:中法元首会谈议题十分广泛 似乎找到更多共识

环球网资讯 浏览 399 12-05

股价大跳水,71岁的万通董事长王忆会被拘留

财视传播 浏览 491 08-19

李想:理想i8发布会大概率要「致敬小米」!特别感谢雷总的「定心丸」;罗马仕中层:五个老板全跑马来西亚了;传阿里副总裁叶军将离职

雷峰网 浏览 3123 07-14

轴距加长150mm Model Y L申报信息曝光

车市红点 浏览 5106 07-17

去海外卷,并不是件坏事

虎嗅APP 浏览 275 11-27

足球报:国足选土帅会杂音更大,未来新帅应擅长防反

懂球帝 浏览 3929 07-12

巴西发起最致命反毒行动:致121人死亡 头号头目逃脱

红星新闻 浏览 321 10-31

美网男单夺冠赔率:辛纳领跑,阿尔卡拉斯第二,德约科维奇第三

直播吧 浏览 499 08-22

特朗普称"无需担心"美印关系 莫迪回应了

看看新闻Knews 浏览 545 09-07

宗庆后三位私生子女行动了

财通社 浏览 1893 07-14

女人过了60岁也别放弃变美!冬季看看这些穿搭,得体又大方

静儿时尚达人 浏览 250 12-14

每月一班 莫斯科与平壤本月底将开通直航

看看新闻Knews 浏览 4911 07-16

支付宝下架首页AQ广告,回应“内斗”传闻,网友:感觉就是一场营销

红星资本局 浏览 383 10-22

俄安-24客机坠毁事件完成调查

国际在线 浏览 405 08-21

小扎把马斯克机器人一号位挖走了

量子位 浏览 421 09-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11