关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者2025-11-11 00:00:01304人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

前皇马中场梅德兰:美国足球人才少工作文化浓厚,沙特则恰恰相反

直播吧 浏览 9678 08-07

新华社权威快报|“中国天眼”揭示快速射电暴双星起源关键证据

新华社 浏览 292 01-16

起拍价7777.77万元,百年历史建筑于济川公馆旧址将被拍卖

红星资本局 浏览 5994 07-28

海航集团原美籍高管、首席执行官获刑6年 详情披露

经济观察报 浏览 4911 07-23

美政府入股芯片企业又传新说法:拟“用补贴换股份”

环球网资讯 浏览 511 08-23

王宁又牛了,今年上半年把去年一整年的钱都赚了

节点财经 浏览 3967 07-18

拓展绿色金融版图,这家券商争做“ESG探路人”!

券商中国 浏览 2551 07-24

在AI智能体真正可用之前,我们还需要做好哪些准备?

DeepTech深科技 浏览 10397 08-07

吉迪库明加互换?要不吉迪库明加联手?

静易墨 浏览 507 08-11

3元面馆因"48元一杯茅台"爆火 店主:身心俱疲 已下架

新民晚报 浏览 6123 07-26

以色列对加沙发动地面进攻 欧盟宣布对以制裁措施

央视新闻客户端 浏览 414 09-18

陕西一金店20公斤黄金被洪水冲走:还有19公斤找不到

鲁中晨报 浏览 1201 07-28

Sora 2和同名视频App问世,欲角逐短视频社交“新王”

DeepTech深科技 浏览 377 10-02

俄官员:乌克兰武装部队正“准备逃离赫尔松”

每日经济新闻 浏览 642 08-18

媒体人:河南成立新篮球俱乐部,CBA未来可能扩军或升降级

懂球帝 浏览 416 09-10

记者:詹姆斯复出后将湖人的快攻水平从倒数后5提升到正数前5

懂球帝 浏览 309 11-27

12岁小学生自杀遗书称写不会英语单词 英语老师:委屈

观威海 浏览 239 01-13

一加 15 真机曝光,设计风格延续一加 13T

IT之家 浏览 399 09-22

高市为当首相对维新会大幅让步 接受其数个"绝对条件"

极目新闻 浏览 362 10-22

男子在北京被沈阳警方带走错关212天 赔偿不够律师费

中国新闻周刊 浏览 10667 08-09

神了!香港一套25㎡的房子,月租1.6万

说财猫 浏览 405 09-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11