关闭广告

清华大学发现:AI教学方法决定死记硬背或真正理解

科技行者2025-09-21 00:00:02168人阅读


这项由香港大学、加州大学伯克利分校以及谷歌DeepMind等顶尖机构联合进行的研究发表于2025年第42届国际机器学习大会(ICML),研究团队由朱天哲、翟越翔等多位学者共同完成。有兴趣深入了解的读者可以通过项目主页https://tianzhechu.com/SFTvsRL获取完整论文信息。

想象你面前有两个孩子在学数学,一个死记硬背乘法表,考试时只要题目稍有变化就抓瞎;另一个真正理解了乘法原理,遇到新题型也能触类旁通。这就是当前AI训练中的一个根本性问题——我们的AI到底是在"死记硬背"还是在"真正学习"?

长期以来,训练AI就像教育孩子一样,主要有两种方法:一种叫做监督微调(SFT),就像传统的填鸭式教育,给AI看大量标准答案,让它模仿;另一种叫做强化学习(RL),更像启发式教育,让AI在尝试中学习,做对了给奖励,做错了给惩罚。但是这两种方法哪种更能让AI真正"开窍",一直是个未解之谜。

研究团队就像教育专家一样,设计了精巧的实验来探究这个问题。他们创建了一个类似"算24点"的数学游戏,给AI四张卡片,让它用加减乘除算出24这个数字。更巧妙的是,他们还设计了不同

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

被落石砸亡司机家属向政府索赔百万遭网暴 当事人回应

极目新闻 浏览 780 07-15

浙江助教:尽全力去拿下胜利;对王钰栋和张瑷晖的缺阵有预案

懂球帝 浏览 87 10-31

媒体:特朗普将与普京会晤 泽连斯基或到附近伺机待命

新民周刊 浏览 3713 08-08

泽连斯基:美国或将购买经"战场检验"的乌克兰无人机

环球网资讯 浏览 3472 07-18

美国务卿:俄乌尚未准备好与特朗普开展三方会谈

每日经济新闻 浏览 7862 08-08

全面战胜ReAct!斯坦福全新智能体推理框架,性能提升112.5%

新智元 浏览 25 12-02

终结3连败!骑士大胜双杀步行者 米切尔43分末节16分

醉卧浮生 浏览 19 12-02

五角大楼当面喝退英航母!百年盟友裂痕显现

浏览 1514 07-14

白宫有新动作,哈佛5800项专利危险了!9月5日最后通牒

上观新闻 浏览 282 08-11

阶跃星辰与“中国英伟达”们成立联盟,今年冲刺10亿元收入

南方都市报 浏览 2217 07-28

比亚迪海狮06上市 售价13.98万-16.38万

网易科技报道 浏览 1993 07-25

35岁副局长公示任乡镇长:21岁时以高中学历获聘为站长

大风新闻 浏览 1884 07-17

美记谈库兹马上赛季表现:可放他一马 突然身背夺冠期待很不容易

直播吧 浏览 5981 08-07

“湘超”来了,湖南省足球联赛将于今年9月至12月期间举行

懂球帝 浏览 4114 07-30

胖东来下场造奶粉,于东来会不会成为乳业雷军?

BT财经 浏览 259 08-19

全智贤风波升级,雪花秘扇时期表现被审判,此前曾多次翻车

扒虾侃娱 浏览 158 09-22

为什么骑手的保障,“普惠”更重要?

财经无忌 浏览 73 10-31

清华大学发现:AI教学方法决定死记硬背或真正理解

科技行者 浏览 169 09-21

“小黑靴”今年冬天又火了!这4组搭配照着搭就很时髦

LinkFashion 浏览 50 11-09

晚餐不吃or吃七分饱,哪种更减肥?

浏览 6605 06-03

曼联名宿:C罗2021年该去曼城,他们制造机会的水平比曼联强多了

直播吧 浏览 5797 07-24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11