关闭广告

清华大学发现:AI教学方法决定死记硬背或真正理解

科技行者2025-09-21 00:00:02335人阅读


这项由香港大学、加州大学伯克利分校以及谷歌DeepMind等顶尖机构联合进行的研究发表于2025年第42届国际机器学习大会(ICML),研究团队由朱天哲、翟越翔等多位学者共同完成。有兴趣深入了解的读者可以通过项目主页https://tianzhechu.com/SFTvsRL获取完整论文信息。

想象你面前有两个孩子在学数学,一个死记硬背乘法表,考试时只要题目稍有变化就抓瞎;另一个真正理解了乘法原理,遇到新题型也能触类旁通。这就是当前AI训练中的一个根本性问题——我们的AI到底是在"死记硬背"还是在"真正学习"?

长期以来,训练AI就像教育孩子一样,主要有两种方法:一种叫做监督微调(SFT),就像传统的填鸭式教育,给AI看大量标准答案,让它模仿;另一种叫做强化学习(RL),更像启发式教育,让AI在尝试中学习,做对了给奖励,做错了给惩罚。但是这两种方法哪种更能让AI真正"开窍",一直是个未解之谜。

研究团队就像教育专家一样,设计了精巧的实验来探究这个问题。他们创建了一个类似"算24点"的数学游戏,给AI四张卡片,让它用加减乘除算出24这个数字。更巧妙的是,他们还设计了不同

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

甲骨文电话会:AI业务井喷 手握4550亿美元订单,推出“AI数据库”剑指万亿推理市场

华尔街见闻官方 浏览 342 09-10

从0到1的突围:离轴三反打造航天“全能镜头”,向深空进发!

中国科普博览 浏览 10191 07-22

百年固特异的中国未来

网易汽车 浏览 178 01-01

插混车纯电续航超过210km,增程车怎么办?

汽车公社 浏览 183 01-08

“裤子+靴子”今年又火了,这样穿时髦又显高

LinkFashion 浏览 189 12-10

我国“大国重器”实现一批标志性成果的重大突破

上游新闻 浏览 349 09-09

“网瘾”犯了,想把法网的红土妆点在身上!

时尚COSMO 浏览 10165 06-26

普京助理喊话北约秘书长:学俄语 听真相

环球网资讯 浏览 7229 07-27

俄乌冲突三年,炮火炸出全球财富新地图

浏览 1465 07-14

丽水机场正式通航

中国青年报 浏览 4482 07-20

“非洲手机之王”,被华为起诉!

网易财经 浏览 10439 08-07

美记谈库兹马上赛季表现:可放他一马 突然身背夺冠期待很不容易

直播吧 浏览 6090 08-07

德约回应针对他受伤的新闻:媒体总爱断章取义

网球之家 浏览 191 01-19

尹同跃宣告奇瑞AI进入2.0时代,要快速追赶特斯拉FSD

贝壳财经 浏览 201 01-19

15元“商超大食堂”硬控打工人

餐饮老板内参 浏览 428 08-25

蜜雪冰城开到公交站乘车享折扣 执法局的人却上门了

每日经济新闻 浏览 319 12-05

周受资,晋升一位90后女将

华尔街见闻官方 浏览 250 10-26

650亿市场引巨头竞逐!小火锅的“热闹”与“挑战”,都在这了

伯虎财经 浏览 316 09-20

刘涛为95花作配,国民女星的资源降级还是新机遇?

八卦三缺一 浏览 321 09-19

怒撕S家后,张兰转身卖货:这个快70岁女人,从未向命运低头!

娱乐白名单 浏览 6676 07-14

董军喊话台湾:随时准备挫败任何外部的武力干涉

政知新媒体 浏览 349 09-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11