关闭广告

清华大学发现:AI教学方法决定死记硬背或真正理解

科技行者2025-09-21 00:00:02400人阅读


这项由香港大学、加州大学伯克利分校以及谷歌DeepMind等顶尖机构联合进行的研究发表于2025年第42届国际机器学习大会(ICML),研究团队由朱天哲、翟越翔等多位学者共同完成。有兴趣深入了解的读者可以通过项目主页https://tianzhechu.com/SFTvsRL获取完整论文信息。

想象你面前有两个孩子在学数学,一个死记硬背乘法表,考试时只要题目稍有变化就抓瞎;另一个真正理解了乘法原理,遇到新题型也能触类旁通。这就是当前AI训练中的一个根本性问题——我们的AI到底是在"死记硬背"还是在"真正学习"?

长期以来,训练AI就像教育孩子一样,主要有两种方法:一种叫做监督微调(SFT),就像传统的填鸭式教育,给AI看大量标准答案,让它模仿;另一种叫做强化学习(RL),更像启发式教育,让AI在尝试中学习,做对了给奖励,做错了给惩罚。但是这两种方法哪种更能让AI真正"开窍",一直是个未解之谜。

研究团队就像教育专家一样,设计了精巧的实验来探究这个问题。他们创建了一个类似"算24点"的数学游戏,给AI四张卡片,让它用加减乘除算出24这个数字。更巧妙的是,他们还设计了不同

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

运-20运输机再赴韩国接志愿军烈士遗骸回家

环球网资讯 浏览 461 09-09

晚点独家丨外卖混战②:淘宝不能停,美团也不能

晚点LatePost 浏览 1263 07-15

勇士和火箭谁更强?斯通:他们赢了我们 没办法这是事实

直播吧 浏览 418 08-23

AVX-512 将重返英特尔 CPU,和 AMD 展开性能对决

IT之家 浏览 8407 08-07

RedPlay新阵地:小红书游戏行业峰会解码「种草用增」新思路

环球网资讯 浏览 263 02-02

经济增长放缓,企业开始裁员,俄罗斯“薪资竞赛”或将很快结束

环球网资讯 浏览 4981 07-28

290亿江阴“男装大王”, 冲刺港股IPO

侃见财经 浏览 463 09-21

暴涨2500亿!首富钟睒睒,彻底“翻身”

侃见财经 浏览 4670 07-24

极氪启动跨代智驾众筹 24款老车主可低价直升Thor-U

网易汽车 浏览 343 11-27

网恋1个月怀孕 45岁女子被61岁男友拉黑:他出轨别人

极目新闻 浏览 308 10-25

小米SU7无法开门驾驶员死亡 雷军未发声累计掉粉29万

新闻坊 浏览 320 10-14

美枪击嫌犯最新画面披露:跳楼、穿街、进林 然后消失

扬子晚报 浏览 404 09-13

G7订单增速远超预期 何小鹏:不卷价格卷技术

网易汽车 浏览 1501 07-12

奥迪将推出全新一代性能车 保留"大排量"内燃机

网上车市 浏览 1003 07-08

云南抗癌女孩离世年仅13岁:半岁时生父心梗猝死

红星新闻 浏览 8045 06-26

车企对激光雷达换赛道,主打纯视觉的车,越来越难卖了?

路咖汽车 浏览 498 05-20

马卡:多家英超俱乐部有意阿布德,巴萨仍有其部分所有权

懂球帝 浏览 291 01-15

"山寨车鼻祖"工厂成零件坟场 曾模仿豪车被称"保时泰"

第一财经资讯 浏览 487 09-16

NASA叫嚣美国"一定会在中国之前登月" 前局长当众拆台

枢密院十号 浏览 472 09-15

乌媒公布现场图:基辅发生军车爆炸事件

环球网资讯 浏览 438 08-19

特朗普宣称中方在他任内不会对台采取行动 外交部回应

外交部网站 浏览 615 08-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11