关闭广告

清华大学发现:AI教学方法决定死记硬背或真正理解

科技行者2025-09-21 00:00:02333人阅读


这项由香港大学、加州大学伯克利分校以及谷歌DeepMind等顶尖机构联合进行的研究发表于2025年第42届国际机器学习大会(ICML),研究团队由朱天哲、翟越翔等多位学者共同完成。有兴趣深入了解的读者可以通过项目主页https://tianzhechu.com/SFTvsRL获取完整论文信息。

想象你面前有两个孩子在学数学,一个死记硬背乘法表,考试时只要题目稍有变化就抓瞎;另一个真正理解了乘法原理,遇到新题型也能触类旁通。这就是当前AI训练中的一个根本性问题——我们的AI到底是在"死记硬背"还是在"真正学习"?

长期以来,训练AI就像教育孩子一样,主要有两种方法:一种叫做监督微调(SFT),就像传统的填鸭式教育,给AI看大量标准答案,让它模仿;另一种叫做强化学习(RL),更像启发式教育,让AI在尝试中学习,做对了给奖励,做错了给惩罚。但是这两种方法哪种更能让AI真正"开窍",一直是个未解之谜。

研究团队就像教育专家一样,设计了精巧的实验来探究这个问题。他们创建了一个类似"算24点"的数学游戏,给AI四张卡片,让它用加减乘除算出24这个数字。更巧妙的是,他们还设计了不同

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

1.2万亿投资 + 新央企加持!超级水电项目引爆市场

躺平指数 浏览 1704 07-21

哈马斯领导人空缺15个月后重组在即 2人成为热门人选

红星新闻 浏览 194 01-15

重磅产品G7终上市,小鹏迎来关键之战

虎嗅APP 浏览 3666 07-06

全世界门槛最高的舞会,投胎大赛赢家都有谁?

FUFASHION 浏览 199 12-21

大学副教授被精神病人持棍打死 二审:凶手发病期作案

扬子晚报 浏览 414 09-29

傅利叶全新人形机器人“Care-bot”GR-3,定义"有爱的"交互新范式

机器之心Pro 浏览 8373 08-07

15岁男生被5名未成年人殴打霸凌 警方通报

界面新闻 浏览 6460 07-10

“智能”凝胶让糖尿病伤口愈合速度翻倍

网易科技报道 浏览 497 08-12

倒计时7天 93秒超前感受盛大阅兵

央视新闻 浏览 237 08-28

万胜智能:累计在手订单超12亿元,新能源汽车领域获重大突破

览富财经网 浏览 403 08-27

偶遇奚梦瑶带儿子看球赛,母子牵手画面温馨

科学发掘 浏览 416 08-21

巴军方称已列装中国制造的直-10ME攻击直升机 国防部回应

环球网资讯 浏览 5156 08-09

谭松韵,为什么百搭?

温柔娱公子 浏览 190 12-29

张朝阳对话诺贝尔奖得主David Gross:解密时空涌现、质量起源与渐近自由

封面新闻 浏览 3768 07-13

最美央视才女,甩掉孙红雷嫁给张嘉益

郑皓文 浏览 340 09-19

寒武纪陈天石:不实

芯榜 浏览 323 09-20

连损四年,台积电称美国厂盈利

观察者网 浏览 418 08-20

上千吨美国大豆滞销,不是中国不买,特朗普该如何挽回中国?

北向财经 浏览 382 08-24

谁是真汇源?

经济观察报 浏览 220 01-21

美国做错了什么,中国做对了什么

观察者网 浏览 2851 07-13

苹果 iOS 26 中 Safari 浏览器默认所有会话启用“先进指纹保护”

IT之家 浏览 9943 07-30
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11