关闭广告

清华大学发现:AI教学方法决定死记硬背或真正理解

科技行者2025-09-21 00:00:02406人阅读


这项由香港大学、加州大学伯克利分校以及谷歌DeepMind等顶尖机构联合进行的研究发表于2025年第42届国际机器学习大会(ICML),研究团队由朱天哲、翟越翔等多位学者共同完成。有兴趣深入了解的读者可以通过项目主页https://tianzhechu.com/SFTvsRL获取完整论文信息。

想象你面前有两个孩子在学数学,一个死记硬背乘法表,考试时只要题目稍有变化就抓瞎;另一个真正理解了乘法原理,遇到新题型也能触类旁通。这就是当前AI训练中的一个根本性问题——我们的AI到底是在"死记硬背"还是在"真正学习"?

长期以来,训练AI就像教育孩子一样,主要有两种方法:一种叫做监督微调(SFT),就像传统的填鸭式教育,给AI看大量标准答案,让它模仿;另一种叫做强化学习(RL),更像启发式教育,让AI在尝试中学习,做对了给奖励,做错了给惩罚。但是这两种方法哪种更能让AI真正"开窍",一直是个未解之谜。

研究团队就像教育专家一样,设计了精巧的实验来探究这个问题。他们创建了一个类似"算24点"的数学游戏,给AI四张卡片,让它用加减乘除算出24这个数字。更巧妙的是,他们还设计了不同

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

连接两个“世界级城市群”,关键工程要“动手”了!

国是直通车 浏览 424 09-11

特朗普:普京已经厌倦了 他们都厌倦了

环球网资讯 浏览 1093 08-20

拥有超灵巧机械手,人形机器人North可打乒乓球、组装纸风车

IT之家 浏览 295 01-09

重大利好!刚刚,直线拉升!

证券时报 浏览 6183 07-30

DiDi联手香港科大首创自动旅行规划AI

科技行者 浏览 323 11-11

雷佳音回应作品太多惹人烦,自己新剧也牵涉其中

手工制作阿歼 浏览 360 10-11

特朗普:将与普京“试探性会晤” 告诉普京结束战争

每日经济新闻 浏览 5338 08-12

约10米高吊罐掉落砸伤3名路人 40岁驾驶员被警察带走

大风新闻 浏览 397 10-15

无人机踢足球!全国航空航天模型锦标赛展现科技与竞技魅力

上观新闻 浏览 4882 07-24

黄多多,一款自带“腥风血雨”体质的星二代

时尚COSMO 浏览 462 08-26

不管人情世故那一套!东风日产法务贴脸开大,直接点了友商的名

小李车评李建红 浏览 277 12-11

交通银行信用卡中心换帅,当年管培生今上位

财经众议院 浏览 4400 07-17

E句话| 梁小龙去世,成龙周星驰发文悼念

仙女事件簿 浏览 297 01-19

鸿蒙智行 2025 年 9 月全系交付新车 52916 台

IT之家 浏览 385 10-02

杜兰特:谢泼德站了出来,我甚至无法形容他今晚有多么出色

懂球帝 浏览 257 12-21

全车三排Nappa真皮包覆 全新别克GL8陆尊座舱信息

网易汽车 浏览 10269 08-02

NBA新赛季里程碑:詹姆斯有望再创多项历史第一

体坛周报 浏览 506 08-20

奥巴马意外现身 庆祝胜利

参考消息网 浏览 277 11-08

跌超80%的渤海银行,又被罚了

市值Observation 浏览 1562 08-06

华为加持、宁德赋能,传祺S9能否在“9系”赛道跑赢?

钛媒体APP 浏览 388 09-21

印航客机坠毁前燃油供应被切断,专家称或因芯片故障

上观新闻 浏览 1680 07-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11