关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者2025-11-11 00:00:01214人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

《大生意人》将至,陈晓出演一代商王,或可比肩《乔家大院》

最爱酷影视 浏览 305 10-15

英超9月赛程:9月14日曼市德比,9月20日红魔战蓝军、枪手对蓝月

直播吧 浏览 4397 07-24

吉利银河A7 EM-i 馈电油耗2L级 续航2100km+

懂车之道 浏览 456 06-09

73岁的唐国强就因一条动态,实现了“口碑暴涨”

大龄女一晓彤 浏览 364 09-11

以军打死数十名哈马斯指挥官 特朗普:应该的

每日经济新闻 浏览 269 10-30

好久没对一双鞋这么心动了!

黎贝卡的异想世界 浏览 248 09-26

刘宇宁表示自己会患得患失,三天没工作会开直播

芊手若 浏览 8280 07-11

半年度百强量化私募榜揭晓!稳博、阿巴马等领衔百亿!

私募排排网 浏览 8404 07-30

搭载华为ADS 4.0 问界M8纯电版申报图发布 8月上市

网易汽车 浏览 2536 07-17

WTA克利夫兰站:王欣瑜1-2挽救5赛点仍惜败李安 无缘晋级决赛

醉卧浮生 浏览 464 08-23

消息称苹果 AirPods Pro 3 充电盒正面引入触控操作区域

IT之家 浏览 398 08-27

空军发布重磅视频 多款新型战机亮相

参考消息 浏览 156 11-12

恒大退市!两个关键人物善终?

大猫研究所Pro 浏览 8998 08-14

刚刚,亚马逊推Agent全家桶!5招连发,狂堆猛料,吹响AI集结号

智东西 浏览 1465 07-17

牛弹琴:高市早苗有点悬了 女首相之路出现重大波折

现代快报 浏览 276 10-11

30年前的今天:Windows 95正式发布!首日就卖了7.2亿美元

快科技 浏览 438 08-25

美乌柏林两日会谈后 特朗普、泽连斯基同日发声

环球时报国际 浏览 223 12-16

美国对俄罗斯新制裁按下暂停键 泽连斯基喊话普京

每日经济新闻 浏览 5996 06-20

赵露思怠工等解约公司天价索赔,将两败俱伤,杨幂杨紫是解约典范

李守智 浏览 7968 08-05

全智贤风波持续发酵,品牌方火速切割,业内估算损失超2亿

扒虾侃娱 浏览 313 09-21

E句话| 《繁花》剧组又回应了?

仙女事件簿 浏览 212 11-09
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11