关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2025-10-22 00:00:02267人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

班主任用"小号"给多名女生发不雅信息 被认定构成猥亵

环球网资讯 浏览 433 08-24

俄石油贸易商要求印度简化流程:直接付人民币

澎湃新闻 浏览 349 10-09

大S妈妈晒自拍照,重拾对生活的信心,率领S家人过新生活

素素娱乐 浏览 135 03-10

暑假已经过去大半,你家孩子“弯道超车”了吗

首席商业评论 浏览 510 08-12

《捕风追影》成近十年最佳动作片,成龙这一次没有令人失望!

电和影 浏览 429 08-20

伊朗总统:战争既不符合伊朗也不符合美国利益

国际在线 浏览 156 02-01

释永信生活"纸醉金迷":出行阵仗堪比皇上 1串珠子亿元

火山诗话 浏览 9565 07-28

你看到的不是奔驰纯电CLA,而是汽车的下一个20年

1号车盟 浏览 184 12-02

新款享界S9将于11月7日正式开启预订

车质网 浏览 182 11-05

从传统车企到入列主流新能源玩家,一汽奔腾突围背后的行业逻辑

第一财经资讯 浏览 9020 07-25

羽毛球新星张志杰猝死引关注

网易健康 浏览 7494 07-03

50岁阿姨也能穿得亮眼高级,这些搭配的技巧请收好,特别实用

静儿时尚达人 浏览 325 09-16

搭载1.5T增程动力 风云X3L将于9月9日上市

车质网 浏览 429 08-18

张馨予减肥致体质差,170身高仅百斤两月发烧三次

把喜欢都给他 浏览 185 02-03

这些是有气质的女性喜欢的穿搭!露肤度合适、多穿裙子更优雅

静儿时尚达人 浏览 6275 07-08

陈立武被特朗普要求辞职后 其名字在美国遭大量侮辱

环球时报国际 浏览 2328 08-10

泰军称边境冲突已致柬方百名士兵死亡 柬方暂无回应

界面新闻 浏览 9986 07-27

英媒:英超可半场采访、进场摄像、拍更衣室,球队可拒绝第三项

直播吧 浏览 2015 07-30

绍兴地铁事故遇难者家属拒透露赔偿额:我们签过"那个"

大象新闻 浏览 377 10-01

车主针对FSD功能起诉特斯拉案将开庭:要求退一赔三

新京报 浏览 204 11-11

卖冰给老外,他年入14亿

快刀财经 浏览 4394 07-18
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11