关闭广告

清华大学发现:AI教学方法决定死记硬背或真正理解

科技行者2025-09-21 00:00:02408人阅读


这项由香港大学、加州大学伯克利分校以及谷歌DeepMind等顶尖机构联合进行的研究发表于2025年第42届国际机器学习大会(ICML),研究团队由朱天哲、翟越翔等多位学者共同完成。有兴趣深入了解的读者可以通过项目主页https://tianzhechu.com/SFTvsRL获取完整论文信息。

想象你面前有两个孩子在学数学,一个死记硬背乘法表,考试时只要题目稍有变化就抓瞎;另一个真正理解了乘法原理,遇到新题型也能触类旁通。这就是当前AI训练中的一个根本性问题——我们的AI到底是在"死记硬背"还是在"真正学习"?

长期以来,训练AI就像教育孩子一样,主要有两种方法:一种叫做监督微调(SFT),就像传统的填鸭式教育,给AI看大量标准答案,让它模仿;另一种叫做强化学习(RL),更像启发式教育,让AI在尝试中学习,做对了给奖励,做错了给惩罚。但是这两种方法哪种更能让AI真正"开窍",一直是个未解之谜。

研究团队就像教育专家一样,设计了精巧的实验来探究这个问题。他们创建了一个类似"算24点"的数学游戏,给AI四张卡片,让它用加减乘除算出24这个数字。更巧妙的是,他们还设计了不同

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

巴黎极端球迷在埃菲尔铁塔前非法燃放大量焰火,约40人被逮捕

懂球帝 浏览 266 12-29

提供两种动力 日产NX8有望于3-4月上市

车质网 浏览 281 01-22

员工超长时间如厕被开除 单次最长4小时辩称护理痔疮

环球网资讯 浏览 308 01-20

安德鲁被英王室扫地出门:曾3次强迫17岁女孩发生关系

新民晚报 浏览 258 11-03

全市场:国米的右路补强仍然悬而未决,冬窗很难进行引援

懂球帝 浏览 271 01-20

偶像剧女王现状:一个拼命生娃,一个坚持不婚

Yuki女人故事 浏览 5783 06-21

618大汇总|| 不乱买!精挑细选的超全功课都在这了

黎贝卡的异想世界 浏览 10598 06-11

18岁女孩发现男友已婚崩溃饮酒跳江 父母索赔法院判了

鲁中晨报 浏览 376 09-22

坐飞机也可以上网 免费畅享"空中Wi-Fi"来了

环球网资讯 浏览 10906 08-21

被批贪婪无度、大搞权色交易 官方通报许雷案最新进展

扬子晚报 浏览 576 09-09

上海交大突破:单一AI模型实现全视觉创作任务

科技行者 浏览 320 01-11

普京开启"罕见"四天访华行 中俄如何沟通乌议题受关注

澎湃新闻 浏览 621 09-01

买了比亚迪的股票不能卖?对!不行,巴菲特也不行!

小李车评李建红 浏览 418 09-25

全球关税违法+库克可能败诉

路财主 浏览 536 09-01

颠覆认知!用这8把“尺子”重新丈量中国餐饮未来!

餐饮老板内参 浏览 412 09-22

心疼小酒窝!亲妈冲动再婚继父想要二胎,9岁就要协调父母关系

萌神木木 浏览 404 08-17

限时6.58万起 2026款吉利星愿正式上市

网易汽车 浏览 355 10-12

中国买家为希腊黄金签证花25万欧买房 如今2万欧卖出

红星新闻 浏览 325 01-15

拉什福德社媒鼓励球队:这是马拉松不是短跑,我们会继续战斗

懂球帝 浏览 331 10-28

迪丽热巴工作室再出“奇招”,粉丝是真没招了

年两 浏览 8369 07-31

北京外援动态!马帝昂或已打完最后一场,正与麦基谈判,状态拉满

篮球资讯达人 浏览 279 01-07
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11