关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2026-01-11 00:00:01241人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

卡萨诺:托蒂是意大利史上最强10号,他的天赋不如巴乔但更加全面

直播吧 浏览 10183 07-13

汪林朋坠楼身亡:其3.72亿股居然智家股票已全被冻结

经济观察报 浏览 8393 07-29

秉承经典 日产Z Heritage Edition官图发布

车质网 浏览 295 09-12

马筱梅被夸情绪稳定,汪小菲改变超明显

甜柠檬吖 浏览 435 08-12

方程豹钛7首台量产车下线

大象新闻 浏览 6902 08-13

痔疮是直肠癌的“导火索”?

网易健康 浏览 6959 02-26

男子在高铁上吸烟被警察戴铐带走 自称"我又没有犯罪"

大风新闻 浏览 385 09-10

上汽大众新凌渡L亮相,初代网红要来收复失地

驾仕派 浏览 8552 08-01

今年秋天最好看的5件风衣!

LinkFashion 浏览 259 09-22

新增车道级导航与全向记录仪 腾势N9迎重磅OTA升级

网易汽车 浏览 275 10-16

疑科考队员公开出售"北极海水":全国仅100瓶 卖9999元

封面新闻 浏览 5481 08-09

新华保险首个中资产康养旅居社区落地开启旅居养老新范式

经理人杂志 浏览 243 10-31

马斯克:特斯拉FSD V14大约6周后发布,参数提升10倍

IT之家 浏览 3617 08-12

古茗:营利增速放缓,产品安全与质量问题频发,公司治理亟待提升|ESG案例

网易财经ESG 浏览 1784 07-15

德国外长:台海要是打起来 将严重影响世界经济贸易

澎湃新闻 浏览 268 10-25

世纪华通2025上半年净利润预计同比增长107.20%-159.00%

证券市场周刊 浏览 2706 07-15

抢先了解!特斯拉新Model Y Performance,这些值得期待吗?

网上车市 浏览 516 05-21

哈马斯外交领域官员从暗杀中幸存 两个儿子已先后遇害

红星新闻 浏览 390 09-11

达利欧警告:美伊在霍尔木兹海峡的"决战"将改变世界

财联社 浏览 146 03-17

利物浦女足前主帅比尔德的葬礼举行,超过六百人参加

懂球帝 浏览 249 10-18

成都双流机场西侧这个公园潮流打卡地加速成形

红星新闻 浏览 433 08-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11