关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2025-10-22 00:00:0299人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

苹果 macOS Tahoe 悄悄引入 15 款全新航拍风景屏保

IT之家 浏览 6214 08-10

很轻松!队记:杨瀚森看起来玩得很开心 一直带着微笑

直播吧 浏览 8531 07-12

180亿公考龙头,努力上岸

21财闻汇 浏览 4729 07-18

斯基拉:阿森纳正在关注铃木彩艳,有意在下个赛季引进他

懂球帝 浏览 24 12-02

做爆款、造IP,外滩新媒体年会跨界圆桌共谋破圈新路径

澎湃新闻 浏览 5424 07-26

医学生被安排到电子厂实习还被克扣工资 当事学校回应

极目新闻 浏览 276 08-23

这次,辛巴踩中“雷区”了

虎嗅APP 浏览 6002 07-29

开价185亿,刘强东竞买德国超市

21世纪经济报道 浏览 5689 07-26

两印度工程师因空难为飞机设计“安全气囊”

极目新闻 浏览 134 09-19

女生被录取为全省唯一女飞行员 被质疑龅牙和斗鸡眼

古希腊掌管松饼的神 浏览 2823 07-26

中国无人机表演一再刷新吉尼斯纪录 记者揭秘幕后故事

每日经济新闻 浏览 3397 07-04

针织+阔腿裤、衬衫+阔腿裤,今年秋天最火搭配,谁穿谁好看!

LinkFashion 浏览 147 09-15

曾烂尾多年 "天下第一水司楼"变酒店国庆三种房型订满

扬子晚报 浏览 180 10-01

西媒:欧足联批准赫罗纳与曼城重启合作,两队间的交易禁令被解除

直播吧 浏览 6699 07-26

“太空快递”签收后航天员在忙什么?中国空间站多领域新实验上线

IT之家 浏览 9781 07-27

许家印出事前,只有他提前果断脱离恒大,至今毫发无损

壹只灰鸽子 浏览 66 10-28

快讯|喜茶上线淘宝闪购:超4000家门店已全量运营

网易科技报道 浏览 266 08-22

官方:“赣超”南昌队更换主场,新主场为江西省奥体中心

直播吧 浏览 206 09-10

华为计划2027年实现城区L4规模商用

观察者网 浏览 8788 07-14

摩恩电气深V之意

富凯财经 浏览 36 11-12

王楚钦孙颖莎横扫陈垣宇蒯曼进四强!第二局逆转,其余两局压制!

篮球资讯达人 浏览 159 10-02
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11