关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2025-10-22 00:00:02270人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国游客在泰国被树砸倒去世 女儿:特意安排退休旅行

潇湘晨报 浏览 5435 07-23

初探苹果 tvOS 26 首个公测版:融合液态玻璃设计

IT之家 浏览 2930 07-25

车崇健被嘉宾集体吐槽!Papi直言他听不懂人话,网友喊话别复合了

萌神木木 浏览 243 10-31

"民营船王"33亿元入主杉杉 继母长子内斗2年双双出局

都市快报橙柿互动 浏览 360 10-11

美团外卖大战战报:即时零售日订单超1.5亿,高频骑手月收入达9793元

红星资本局 浏览 9785 07-13

端侧AI芯片公司2025市值图谱

爱集微 浏览 177 01-28

新赛季不打CBA~侯向锋:张博源去美国参加训练营 同时联系学校

直播吧 浏览 10362 08-10

内推前任成了最时髦的恋爱运动

虎嗅APP 浏览 5921 07-27

江西“星火一号”项目计划2029年底完成装置建设,2030年演示发电

IT之家 浏览 5204 08-10

宋丹丹随口的婚姻心得,彻底揭起来了董璇张维伊婚姻的“遮羞布”

娱乐圈笔娱君 浏览 1520 08-05

罗帅宇大伯:举报材料有11.6斤 在他宿舍发现打斗痕迹

大风新闻 浏览 4295 06-14

7座布局/2.5T混动 全新现代帕里斯帝8月4日国内首发

网易汽车 浏览 6873 07-23

贵州农商联合银行来了,贵州省联社官宣启动组建

湘财Plus 浏览 4786 07-30

顶楼住户拆除楼板升高数米加盖 一楼出现从上到下裂缝

大风新闻 浏览 206 12-19

特朗普将宣布对乌军援新计划 或包括进攻性武器

环球网资讯 浏览 1334 07-15

以伊冲突:伊朗610人死亡 以色列28人死亡

新京报 浏览 10534 06-26

里奇:对阵利物浦时比踢阿森纳时有进步,我们给予对手充分的尊重

直播吧 浏览 6125 07-28

九十年代的双生传奇:菲亚特Bravo与Brava

老爷车 浏览 249 11-04

天文学家抓到“宇宙闪电侠”史上最亮一闪

IT之家 浏览 413 08-23

哈马斯宣布将解散加沙政府机构 并准备移交管理权力

国际在线 浏览 196 01-12

北大被指联系"韦神"家属望注销其账号

环球网资讯 浏览 3668 06-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11