关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2026-01-11 00:00:01361人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

白百何声明翻车!晒对接聊天记录漏洞百出,工作室评论区沦陷

萌神木木 浏览 330 11-10

一万亿美元!马斯克薪酬细节拆解

帮宁工作室 浏览 444 09-10

读懂IPO|锡华科技实控人亲属和员工现身多家供应商,核心产品毛利率碾压同行却增收不增利

时代周报 浏览 430 09-20

外媒:俄坠毁客机运营商曾被查出多项严重违规行为

参考消息 浏览 6259 07-29

西媒:巴萨对亚马尔和内马尔度假一事非常不满,担心他被带坏

懂球帝 浏览 450 08-22

左脚低射破门,加纳乔成为切尔西队史第6位进球的阿根廷球员

懂球帝 浏览 297 10-28

曝曼联与沙特谈B费转会价格!B费想自己主宰未来,拜仁或加入争夺

罗米的曼联博客 浏览 394 10-13

光峰科技“认领”闪极AI显示眼镜S1:采用蜻蜓G1 mini光机

IT之家 浏览 266 01-05

高校通报“保安将学生外卖扔垃圾桶”:保卫处长停职

环球网资讯 浏览 429 09-19

今年夏天流行的“多巴胺裙子”太美了,时髦又减龄!

LinkFashion 浏览 4101 07-25

科学家发现首批 45 亿年前“原始地球”痕迹,揭示太阳系早期秘密

IT之家 浏览 348 10-20

中国最低调的并购女王:从打工妹,到主导16次并购大案

快刀财经 浏览 3934 07-27

王鹤棣工作室凌晨声明:聊天录音已递交司法处理

现代快报 浏览 492 08-26

卡塔尔航空公司宣布陆续恢复中东多地航班

界面新闻 浏览 5196 07-01

首个有期徒刑正式宣判,恒大、中植“关键人”一个都跑不了!

深蓝财经 浏览 291 11-12

从性丑闻到RWA第一股,Figure的“美国骗局”

虎嗅APP 浏览 9780 08-09

前三季度增利不增收,三全食品错失预制菜风口后押注肉制品

时代周报 浏览 343 10-29

福建女商人林惠荣提国赔申请获立案 曾服刑7年获无罪

澎湃新闻 浏览 280 01-20

抹黑胖东来吸粉引流再带货 "柴怼怼"抖音等账号被关

极目新闻 浏览 4592 07-03

伊朗武装部队负责人被证实在以色列袭击中死亡

央视新闻客户端 浏览 2061 06-14

俄用近600架无人机、26枚导弹袭击乌 泽连斯基求助

每日经济新闻 浏览 5346 07-13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11