关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2025-10-22 00:00:02352人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

穆勒:我认为这场美职联决赛非常棒;再次见到梅西他们很开心

懂球帝 浏览 271 12-05

甘肃再通报"幼儿血铅异常":天水市委书记、市长被立案

央视新闻客户端 浏览 8081 07-21

魅族为小米 2025 雷军演讲喝彩:不为对标而改变,要为创新而点赞

IT之家 浏览 436 09-26

杨洋晒出撕拉片,网友:想要啥他拍啥

韩小娱 浏览 6581 07-10

Word再见!华为和WPS联手攻克难题:一句话生成PPT、PDF/Excel大文件秒开

快科技 浏览 260 02-02

丹麦赛石宇奇击败阿塞尔森进决赛

体坛周报 浏览 267 10-19

豆包手机助手宣布将部分调整AI操作能力

中新经纬 浏览 262 12-05

90后小伙靠非遗闯入时尚圈,年销超100万,上过21次央视节目

电商在线 浏览 3025 07-17

英伟达CES亮出新牌

北京商报 浏览 301 01-07

2024年度上海市科学技术奖公布,来看获奖名单→

上观新闻 浏览 519 08-26

以专家:以色列唯一正确选择 就是100%服从特朗普安排

中国新闻周刊 浏览 348 10-23

13亿入股千里科技,奔驰缘何加速在华布局智能化?

时代周报 浏览 399 09-26

《秋雪漫过的冬天》首播,不如原版韩剧好看

马庆云的影音娱 浏览 291 01-11

小米准车主遇30天尾款"通牒":不支付2万元定金不退

红星资本局 浏览 604 08-22

告别卡粉斑驳!保姆级遮瑕教程,手把手教你黑眼圈痘印全隐形

Yuki女人故事 浏览 211 12-10

下一代Supra,丰田与雷克萨斯双生车型

MOTO 浏览 4246 06-26

加强银行间外汇市场监管 新规正在征求意见

中国商报 浏览 591 08-26

日产携左舵版N7亮相2025日本移动出行展

网易汽车 浏览 302 10-30

国航一航班氧气面罩系统故障返航

界面新闻 浏览 321 08-29

娃哈哈争产案第二被告唯一董事为宗馥莉

每日经济新闻 浏览 9450 07-22

老黄自曝皮衣口袋藏“秘密期权池”!随时准备奖励优秀员工

量子位 浏览 5724 07-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11