关闭广告

清华大学发现:AI教学方法决定死记硬背或真正理解

科技行者2025-09-21 00:00:02332人阅读


这项由香港大学、加州大学伯克利分校以及谷歌DeepMind等顶尖机构联合进行的研究发表于2025年第42届国际机器学习大会(ICML),研究团队由朱天哲、翟越翔等多位学者共同完成。有兴趣深入了解的读者可以通过项目主页https://tianzhechu.com/SFTvsRL获取完整论文信息。

想象你面前有两个孩子在学数学,一个死记硬背乘法表,考试时只要题目稍有变化就抓瞎;另一个真正理解了乘法原理,遇到新题型也能触类旁通。这就是当前AI训练中的一个根本性问题——我们的AI到底是在"死记硬背"还是在"真正学习"?

长期以来,训练AI就像教育孩子一样,主要有两种方法:一种叫做监督微调(SFT),就像传统的填鸭式教育,给AI看大量标准答案,让它模仿;另一种叫做强化学习(RL),更像启发式教育,让AI在尝试中学习,做对了给奖励,做错了给惩罚。但是这两种方法哪种更能让AI真正"开窍",一直是个未解之谜。

研究团队就像教育专家一样,设计了精巧的实验来探究这个问题。他们创建了一个类似"算24点"的数学游戏,给AI四张卡片,让它用加减乘除算出24这个数字。更巧妙的是,他们还设计了不同

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

从宫廷珍馐到全民日常,海参缘何成为中式滋补新风尚?| CBNData报告

第一财经商业数据中心 浏览 366 09-10

该!买!包!了!30款绝美初秋包包!拿去!

Yuki女人故事 浏览 291 09-08

嘎子哥名下4家公司均已注销

金融界 浏览 409 08-26

美驱逐舰驶近伊朗海域 伊朗直升机驱逐遭警告

看看新闻Knews 浏览 7026 07-24

独居安全APP“死了么”登顶苹果应用付费榜,功能短板遭用户吐槽,已出现多款类似软件

扬子晚报 浏览 198 01-15

流行了100年的CP?大衣+阔腿裤,不过时的高级

LinkFashion 浏览 165 01-28

150余封加税函威胁,同步推进高压谈判,特朗普的策略能否奏效

第一财经资讯 浏览 1317 07-18

早期中华文明多模态大模型等多项创新成果亮相WAIC2025

环球网资讯 浏览 2244 07-27

中国资产持续火热!IIF:8月近四百亿美元外资净流入中国股债

财联社 浏览 348 09-11

俄称已控制库皮扬斯克 正清缴乌军

每日经济新闻 浏览 160 12-28

预售惨淡人气暴跌 谁也救不了“狂妄自大”的那英

素衣读史 浏览 4723 07-16

视频:阅兵训练现场女民兵真飒

中国军号 浏览 314 08-21

售16.59万元起 改款奥迪A3家族正式上市

网易汽车 浏览 244 10-14

西媒:塞蒂恩在国安表现出色,足球战术风格赏心悦目

懂球帝 浏览 436 08-22

女性更容易后悔?新研究揭示大脑决策机制

澎湃新闻 浏览 8194 07-21

Artificial Analysis评测新鲜出炉:Kimi K2 thinking位居世界第二,开源第一

AI寒武纪 浏览 239 11-08

8月"零小蔚"交付量均创历史新高 理想掉队

财联社 浏览 370 09-02

ChatGPT跟进阿福,AI健康按下快进键

海克财经 浏览 200 01-11

木兰花谢,鸳鸯蝶飞:雪妮唐佳半世纪传奇爱情的最后一幕

仙女事件簿 浏览 9648 07-10

E句话| 马尔福已经成了马年吉祥物?

仙女事件簿 浏览 174 02-05

消费电子龙头立讯精密正式递表港交所

国际金融报 浏览 479 08-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11