关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2026-01-11 00:00:01363人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

韩媒:韩国女足抗议足协只让男足坐商务舱,情况严重可能罢赛

懂球帝 浏览 356 10-21

继与霉霉恋情谣言后,里弗斯被传约会网红

艺兔体坛 浏览 307 01-05

76岁穿Prada的时尚女魔头,才是真岁月不败美人

LinkFashion 浏览 487 08-20

为期3天,2025世界人形机器人运动会开启足球预选赛

贝壳财经 浏览 8772 08-12

乌军突袭俄本土,普京面临严峻挑战

浏览 9641 07-14

50胜比肩德约!辛辛那提大师赛:阿尔卡拉斯两盘横扫晋级16强

全景体育V 浏览 552 08-13

女大避父!倪萍戳穿董璇半路夫妻的残酷

科学发掘 浏览 9531 08-07

一年前“掐点”成立 多只基金无缘“翻倍基”

证券时报 浏览 389 09-29

澳海滩枪案致16死 中国亲历者:流传还有"第三名枪手"

红星新闻 浏览 297 12-15

鹈鹕114-104战胜公牛,锡安复出得18+6,墨菲20+10

懂球帝 浏览 278 12-15

量产型Atlas进步巨大,但波士顿动力前途依旧黯淡

汽车公社 浏览 276 01-17

李昊:扑救就是一个小部分,最重要的是大家整体的防守

懂球帝 浏览 396 09-10

法院将拍卖两只涉刑案的百达翡丽腕表 起拍价超6000万

红星新闻 浏览 2393 08-13

何炅瞒着谢娜现身演唱会,现场发言一度抹泪

韩小娱 浏览 123 05-06

销量卖爆了!这些小零食好吃到爆,你买来试试!

Yuki女人故事 浏览 9425 08-01

"桦加沙"来袭 香港女子住38层感觉楼体晃动:挺吓人的

红星新闻 浏览 461 09-25

马斯克回应争议:没有见过任何由Grok生成的未成年人裸照

IT之家 浏览 310 01-15

贝克汉姆晒14岁哈珀滑雪照,眉眼精致美人胚子

译言 浏览 230 02-24

长城汽车与贾跃亭重磅合作!

电动知家 浏览 9312 07-24

“岭南中医药文化传承周”在京启幕!广药非遗亮相中国非遗馆

伯虎财经 浏览 1860 07-17

NBA战报:凯尔特人111-107魔术,班凯罗28分

懂球帝 浏览 320 11-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11