关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者2026-01-28 00:00:01174人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

记者:埃弗顿最近对格拉利什的追求力度最大

懂球帝 浏览 9528 07-30

工业设计软件逆势活跃 华大九天等创年内新高

第一财经资讯 浏览 278 10-13

专家:俄乌走向取决于特朗普态度和美欧关系会否破裂

中国新闻周刊 浏览 4703 07-14

数学界顶流陶哲轩缺钱了!美国留不住人,中国这次能捡个大宝贝吗

首席商业评论 浏览 356 09-11

标配升级 全新2025款星纪元ES售18.98万元起

网易汽车 浏览 365 05-20

俄用近600架无人机、26枚导弹袭击乌 泽连斯基求助

每日经济新闻 浏览 5245 07-13

能钻透更深岩层 美军研制巨型钻地炸弹新型号

环球网资讯 浏览 2123 06-26

世体:因身体轻微不适,巴萨新援帕西菲科首秀将推迟

懂球帝 浏览 173 02-05

陈伟霆无预警官宣结婚生子,与何穗相恋6年终圆满,众星发声祝福

扒虾侃娱 浏览 310 10-18

年轻人迷上缝纫机:有女生1个月光买布就花了好几千元

极目新闻 浏览 350 09-18

美媒承认:乌重镇即将被攻克

环球时报国际 浏览 213 11-11

比亚迪 9 月新能源汽车总销量 396270 辆,同比下滑 5.5%

IT之家 浏览 317 10-02

复旦大学OpenNovelty:让AI成为学术论文同行评议的"火眼金睛"

科技行者 浏览 186 01-11

更大力度遏制“内卷式”竞争!专家:修订价格法正当其时

国是直通车 浏览 974 07-25

网友称38年前买的威力洗衣机还能用 厂家:公司没倒闭

极目新闻 浏览 443 09-10

5-1!石家庄大胜五超揭幕战,直播吧全程转播

直播吧 浏览 435 08-11

毛茸茸的冬天,毛孩子们都在想什么?

时尚COSMO 浏览 132 11-30

蒋欣节目中直言自己没人追,理想型竟然是他!

青史楼兰 浏览 219 11-08

快看漫画多位早期投资者和高管退出,创始人曾是千万粉丝网红,行业正经历深度调整

红星资本局 浏览 158 02-05

董璇不想办婚礼!全程被张维伊和亲妈推着走

萌神木木 浏览 397 08-24

大S纪念雕像揭幕时间曝光 具俊晔小S揭开黑色帆布

扒虾侃娱 浏览 154 01-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11