关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2026-01-11 00:00:01364人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

阿达尼:人们喜欢制造争议,认为索默神扑是理所当然失误就该替补

直播吧 浏览 407 09-21

这些才是气质女人都喜欢的穿搭!不花哨、不俗艳,舒适又自然

静儿时尚达人 浏览 7123 06-18

中国资产大爆发!金价跳水,失守3390美元关口

21世纪经济报道 浏览 8443 07-24

张泉灵硬核督战,CEO当场跑路,万千惠真的被做局了?

仙女事件簿 浏览 413 09-22

荣耀亲选耳夹式耳机2 Pro曝光:金线充电盒加持,支持空间音频

IT之家 浏览 305 11-09

"希腊船王"继承人战胜癌症 被虫子咬一口莫名其妙死了

新民晚报 浏览 545 09-22

双电机还不够?三电机都来了 新款阿维塔12申报图曝光

网易汽车 浏览 302 01-10

实用|| 百元外套穿出万元既视感,这个思路太妙了!

黎贝卡的异想世界 浏览 244 12-19

英伟达发布RTX Spark超级芯片,开启个人AI计算机新纪元

IT之家 浏览 72 06-02

英伟达H20芯片将重启销售 华强北供应商:价格还没降

时代财经 浏览 3728 07-17

自动驾驶真的来了 两款车型分别在北京/重庆获准上路

网易汽车 浏览 301 12-16

死磕影像十一年:vivo探索另一种可能

远川研究所 浏览 353 10-16

OpenAI首批智能硬件:挖苹果人才,立讯代工

财联社 浏览 393 09-20

纵横外卖江湖十三载!美团做对了什么?

互联网那些事 浏览 244 03-03

A股红火!42家上市券商中报出炉:10家净利翻倍,人均薪酬也涨了

红星资本局 浏览 486 09-01

美国"出手" 批准向乌克兰出售价值1.8亿美元防空系统

每日经济新闻 浏览 5895 07-26

和全世界最会穿的女人,学气质搭配

LinkFashion 浏览 6792 07-02

鸿蒙与它的1000万“合伙人”

雪豹财经社 浏览 301 12-02

华为智慧屏新品MateTV Max今日预售,110英寸64999元

IT之家 浏览 325 11-25

“比亚迪的资源不支持搞内部 ‘赛马’,只能去跟外部竞赛”

虎嗅APP 浏览 10520 07-31

机关算尽太聪明!“千亿儿媳”如今彻底成笑话?

冷紫葉 浏览 2956 07-18
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11