关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2026-01-11 00:00:01246人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

乌克兰称不需要中国作为提供安全保障的国家 中方回应

澎湃新闻 浏览 493 08-23

香港闹市发现二战时期美军投射炸弹 耗时12个小时拆除

新民周刊 浏览 411 09-22

美伊冲突两个月尘埃未定 伊朗或仍保留约70%导弹库存

看看新闻Knews 浏览 24 04-29

机主称手机莫名被停机超半个月 运营商:号码为高风险

红星新闻 浏览 269 10-23

呼吸困难,需要警惕!

人民网 浏览 4678 11-22

全球第一性感女神回归,先别急着夸

独立鱼 浏览 9032 07-09

俄客机坠毁49人全部遇难 普京默哀一分钟

界面新闻 浏览 1320 07-26

苹果iPhone 17e首次支持eSIM!单SIM卡+eSIM/双eSIM

快科技 浏览 146 03-03

太励志!埃泽10年前被米尔沃尔解约:我发誓一定会成功,到时候见

直播吧 浏览 442 08-22

是否以入选英格兰队为目标?勒温:努力训练,顺其自然

懂球帝 浏览 188 12-21

金正恩访华后朝鲜加速对中国开放 建成10年大桥将运营

沧海旅行家 浏览 403 09-20

美女克拉拉官宣离婚,6年豪门婚姻告终

代军哥哥谈娱乐 浏览 306 10-18

孩子少吃糖就不会坏牙?

网易健康 浏览 9805 03-21

三年穿越风雷,浙商银行董事长到龄辞任

达摩财经 浏览 5459 07-12

中学发喜报疑"责怪学生":多名高分学生拒报清华北大

潇湘晨报 浏览 8005 07-23

马年“春晚”排成这样,我断言:观众看完,会站起来鼓掌

皮皮电影 浏览 206 01-13

记者:纽卡斯尔对佳夫感兴趣并已展开接触,但目前尚未正式报价

直播吧 浏览 8394 08-07

美国击沉4艘委内瑞拉船 俄罗斯掀桌子拿出重要协议

南宫一二 浏览 388 09-21

程又青,30岁的你也会生长痛吗?

时尚COSMO 浏览 253 09-27

方圆X阿爆,爆款连出一个月,她们凭什么?

时尚COSMO 浏览 244 10-01

澎湃OS优化进展公布,小米15手机相机体验等问题已修复

IT之家 浏览 191 12-15
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11