关闭广告

清华大学发现:AI教学方法决定死记硬背或真正理解

科技行者2025-09-21 00:00:02336人阅读


这项由香港大学、加州大学伯克利分校以及谷歌DeepMind等顶尖机构联合进行的研究发表于2025年第42届国际机器学习大会(ICML),研究团队由朱天哲、翟越翔等多位学者共同完成。有兴趣深入了解的读者可以通过项目主页https://tianzhechu.com/SFTvsRL获取完整论文信息。

想象你面前有两个孩子在学数学,一个死记硬背乘法表,考试时只要题目稍有变化就抓瞎;另一个真正理解了乘法原理,遇到新题型也能触类旁通。这就是当前AI训练中的一个根本性问题——我们的AI到底是在"死记硬背"还是在"真正学习"?

长期以来,训练AI就像教育孩子一样,主要有两种方法:一种叫做监督微调(SFT),就像传统的填鸭式教育,给AI看大量标准答案,让它模仿;另一种叫做强化学习(RL),更像启发式教育,让AI在尝试中学习,做对了给奖励,做错了给惩罚。但是这两种方法哪种更能让AI真正"开窍",一直是个未解之谜。

研究团队就像教育专家一样,设计了精巧的实验来探究这个问题。他们创建了一个类似"算24点"的数学游戏,给AI四张卡片,让它用加减乘除算出24这个数字。更巧妙的是,他们还设计了不同

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小红书将组建大商业板块,柯南担任总负责人

时代财经 浏览 6433 08-14

因本菲卡有欧冠资格赛,鲁伊-科斯塔缺席若热-科斯塔的葬礼

懂球帝 浏览 8955 08-07

动力更强重量更轻 2026款宝马M2 CS发布

车质网 浏览 389 05-28

Jane Street、Citadel Securities三季度业绩强劲,全年有望创纪录

华尔街见闻官方 浏览 182 12-02

杰伦-布朗父亲保释金30万美元 律师称老布朗遭对方用手枪柄敲击!

直播吧 浏览 425 08-22

抵达意大利,拉斯帕多里:很高兴能回来,我很激动且充满动力

懂球帝 浏览 201 01-15

孕妇乘坐济州航空途中足月生产 新生儿没有呼吸

潇湘晨报 浏览 7423 06-03

将四季度亮相 岚图泰山轻伪装实车图曝光

车质网 浏览 463 08-25

留得下、住得稳、有发展,淘宝闪购饿了么“城市骑士之家”创新骑士权益保障

上观新闻 浏览 279 09-20

梁小龙死因被爆!去世前一天还在练咏春

阿坹武器装备科普 浏览 189 01-20

谷歌IMO金牌级Gemini 3深夜上线!华人大神挂帅,OpenAI无力反击

新智元 浏览 151 12-05

尾盘,涨停!一则传闻,突然引爆!

券商中国 浏览 459 08-20

新进英伟达、清仓苹果!私募巨头持仓曝光

中国基金报 浏览 3432 08-10

预警!到2100年!韩国或再也种不了苹果

看看新闻Knews 浏览 271 10-15

正式发布倒计时!Windows 11 25H2进入RP通道:用户已可升级

快科技 浏览 383 09-01

3-1击败美洲狮,迈阿密国际晋级北美联赛杯8强

懂球帝 浏览 9412 08-07

男子举报污染被打获赔后被抓又无罪:镇书记定的赔偿金

重案组37号 浏览 465 09-21

医生强奸2名未成年女孩被判6年 其检察官父亲任辩护人

澎湃新闻 浏览 8342 08-07

爆雷!特斯拉暴跌8%,交出10年来最惨季报

21世纪经济报道 浏览 4437 07-25

狂揽43亿资本,李东生谋局面板扩张

21财闻汇 浏览 445 08-22

视界大会后台社交名利场!欧豪起身主动接杨幂,剧组之间互相抱团

萌神木木 浏览 223 11-04
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11