关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2026-01-11 00:00:01242人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

泽连斯基:反对“用乌克兰领土交换和平”

澎湃新闻 浏览 10160 08-10

出售中国区股权,星巴克CEO透露正对超20个意愿机构进行评估

国际金融报 浏览 1910 07-31

内分泌科专家破解身高八大谣言

网易健康 浏览 279 09-03

免保育教育费政策覆盖所有幼儿园大班儿童

网易财经 浏览 7743 08-07

以军方称空军、海军和地面部队都在加沙地带开展行动

环球网资讯 浏览 293 09-30

叶珂复出野心不小!放话谁也别想阻止她,妖怪过往爆料都没了

萌神木木 浏览 6384 08-08

横滨胜王楚钦后立Flag!张本智和:目标是世界第一,因此不能休息

直播吧 浏览 1262 08-14

何聪睿剧扑甩锅女主,本人发声道歉

扒虾侃娱 浏览 201 01-21

全面下线“零元购”!上海市监向有关平台同步了解情况

红星资本局 浏览 6928 07-24

无缘美网种子,王欣瑜辛辛那提遭世界第二复仇!

网球之家 浏览 495 08-12

让机器人给你生娃,这个世界已经魔幻到这种地步了吗?

花朵财经 浏览 488 08-12

26款名爵MG7限时11.69万起 好玩才是必杀技

网易汽车 浏览 207 01-08

寄件强制刷脸为哪般?用户质疑:网点标准不一,担心隐私泄露

南方都市报 浏览 1395 07-17

穆迪:追梦是我的篮球导师 他还教过我投资、理财和艺术

直播吧 浏览 4578 07-26

俄罗斯卢布兑美元升破79 创2023年6月以来的最高水平

每日经济新闻 浏览 2590 05-30

小米汽车磁吸物理按键已接入米家,还可以放在家里使用

环球网资讯 浏览 7725 08-06

不吃辣不喝酒就不会得痔疮?

网易健康 浏览 8958 02-26

于根伟激励全队:付出最大的努力,把最后4轮比赛“咬”下来

懂球帝 浏览 272 10-16

非必要不读博

识局 浏览 6047 08-07

韩国市场:中国产电动车占比飙升至 34%!

郑谊 浏览 131 02-21

特斯拉Model Y低调升级?标配16寸2K大屏+0息政策

大李说车 浏览 206 01-07
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11