关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2025-10-22 00:00:02351人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

阚清子37岁圆梦当妈,新婚丈夫关心不够?

趣文说娱 浏览 9319 07-24

小鹏全新P7来了!何小鹏:投入最大情感

网上车市 浏览 469 05-17

这些才是适合普通人的穿搭!秋天多穿蓝色单品和风衣,好耐看

静儿时尚达人 浏览 334 10-27

前三季度GDP增速暂居全国首位,湖北挑战“中部第一省”

时代周报 浏览 328 10-27

张维伊换了新造型大变样,有点当红明星的派头了

萱小蕾o 浏览 462 09-11

司晓迪控诉李云迪!趁自己睡着干龌龊事还拉黑她,喊话男方别惹她

萌神木木 浏览 255 10-31

降温了!羽绒服这样穿显瘦又时髦

LinkFashion 浏览 278 01-27

良子的400斤大胃袋,装不下他的七宗罪

虎嗅APP 浏览 488 09-01

著名音乐人何厚华英年早逝:终生未婚

历来纵横 浏览 401 09-29

输球后摔拍发泄!乒协官方:孙闻停赛一轮,不得参与今天上午比赛

直播吧 浏览 489 09-01

官方:莱切队长巴斯基罗托重返克雷莫内塞;据悉转会费300万欧

懂球帝 浏览 7576 07-30

苏州90后小伙买房被熟人骗2062万 开了间"反诈咖啡馆"

扬子晚报 浏览 6364 08-06

何鸿燊仨子女观礼阅兵,何超琼带了三房的弟弟

叶公子 浏览 387 09-07

一架美军MQ-9"死神"无人机坠毁

国际在线 浏览 76 05-31

万科:董事长辛杰辞职

网易财经 浏览 282 10-13

小区为广场舞人群装定向音响 网友呼吁:建议全国推广

环球网资讯 浏览 1162 07-26

50+姐姐别乱穿!这4个秋天“显贵”的搭配思路,越老越有韵味

静儿时尚达人 浏览 424 09-27

深圳机场口岸查获200余只昆虫类“异宠”

环球网资讯 浏览 440 09-21

"车顶维权"后被判向特斯拉道歉赔偿 女车主回应败诉

扬子晚报 浏览 7636 07-12

罗永浩:董宇辉单飞后年收入20亿 此前北京买房还借钱

扬子晚报 浏览 559 08-18

"靠金融吃金融"敛财逾8000万 67岁农行原副行长判无期

南方都市报 浏览 615 08-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11