关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2025-10-22 00:00:02268人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

隆源股份历史合资身份或存涉税风险,寄售库存商品监盘比例竟不足1%,国金证券是否尽责?|读懂IPO

时代周报 浏览 190 01-07

从胶体物理到创新药,南科大团队提出大分子药物稳定新理论

DeepTech深科技 浏览 177 01-19

中俄联演 中方现役主战舰艇齐发

极目新闻 浏览 1072 08-10

田栩宁恋情风波再升级!疑似若若回应恋情,喊话外界少打听别惹她

萌神木木 浏览 285 10-14

男子到机场懵了:飞机提前5小时起飞

潇湘晨报 浏览 6077 07-12

菲非法"坐滩"57号舰释放小艇"碰瓷"挑衅 中国海警管制

界面新闻 浏览 396 08-23

官员迅速赴美交涉,媒体发表社论抗议,韩国愤怒被美国“打了一闷棍”

环球网资讯 浏览 342 09-09

牛市来了?当下阶段该选什么基金

炒基蛋 浏览 8269 07-29

卖爆了!谁在“抄底”深圳

博闻财经 浏览 306 09-21

开工首日,雷军给员工发红包(多图)

三言科技 浏览 139 02-24

AUDI首款战略车型上市 推动奥迪在华电动化战略加速落地

经济观察报 浏览 310 09-21

帮助截瘫患者重获运动功能,华山神外脑机接口团队在上海先进事迹报告会分享创新故事

上观新闻 浏览 214 11-12

扶我起来,再生1个娃,再薅1万块!

越女事务所 浏览 6512 07-29

切尔西都得喊声哥哥!利物浦1天花1.9亿欧签2人 今夏共砸5.3亿欧

风过乡 浏览 394 09-02

美图2025上半年:净利润4.67亿元 同比增长71.3%

网易科技报道 浏览 443 08-19

6款中医食疗方,对症调理偏头痛

人民网 浏览 1996 06-13

E句话| 他们将补办婚礼?

仙女事件簿 浏览 178 10-31

星爷的《美人鱼2》怕是要糊,投资6亿拍了7年,已经没什么可盼了

最爱酷影视 浏览 390 09-09

新国标来了!曾经吹上天的辅助驾驶要“变天”了

知嘹汽车 浏览 38 04-22

利润蹿升330%,固态电池独角兽,藏不住了!

飞鲸投研 浏览 8105 08-10

宁波银行业绩快报:上半年净利润147.72亿 同比增8.23%

网易财经 浏览 10475 07-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11