关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2025-10-22 00:00:0298人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

曝窦骁婚变原因!何超莲曾怀孕又流产,相关照片被扒女方变化明显

萌神木木 浏览 92 10-22

福州一动物园回应狮子瘦骨嶙峋:已步入老年阶段

环球网资讯 浏览 4440 07-23

44岁阿娇自曝手抖出肝不太好,已戒酒一年多

小咪侃娱圈 浏览 81 10-26

叶童、钟楚曦的新中式穿搭也太美了!照着穿美出新高度

LinkFashion 浏览 6980 07-09

OpenAI罕见开源两款模型,奥特曼:这是耗费数十亿美元的成果

网易科技报道 浏览 6694 08-06

即将HWG,努涅斯将与利雅得新月签下一份为期三年的合同

懂球帝 浏览 4598 08-07

货车司机遗失13块银砖:价值百万 找不回来就得赔

封面新闻 浏览 179 09-18

阿里涨超18%,芯片有“后备方案”

观察者网 浏览 224 09-02

“车圈拼多多”盈利了,零跑汽车股价翻倍市值千亿

达摩财经 浏览 241 08-21

参加过抗战的老战士起身敬军礼

人民日报 浏览 148 09-04

9月24日广东省内所有高铁及普速列车停运

南方都市报 浏览 170 09-23

银行长期限存款“退场”背后

北京商报 浏览 54 11-10

300353,重大资产重组!明日复牌

中国基金报 浏览 63 11-03

减重版司美格鲁肽正式上市!

网易健康 浏览 9823 11-27

星巴克王牌品类茶拿铁系列焕新升级,真茶真奶 真茶拿铁

财经无忌 浏览 242 08-19

李嘉欣黎姿携老公聚餐,两大豪门夫妻甘愿镶边,C位是郭晶晶闺蜜

不八卦会死星人 浏览 220 09-06

利物浦1-0豪取三连胜!3年首胜阿森纳,索博世界波

奥拜尔 浏览 209 09-01

于朦胧母亲:于朦胧系饮酒意外坠亡

极目新闻 浏览 143 09-17

时隔20年,“穿Prada的女魔头”又来了!

黎贝卡的异想世界 浏览 9761 08-02

综艺毁人?被低估的辛芷蕾,给了多少“跨界演员”一记耳光

娱乐圈笔娱君 浏览 187 09-10

暴跌51%!“医美面膜第一股”,业绩暴雷!

侃见财经 浏览 260 08-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11