关闭广告

清华大学发现:AI教学方法决定死记硬背或真正理解

科技行者2025-09-21 00:00:02404人阅读


这项由香港大学、加州大学伯克利分校以及谷歌DeepMind等顶尖机构联合进行的研究发表于2025年第42届国际机器学习大会(ICML),研究团队由朱天哲、翟越翔等多位学者共同完成。有兴趣深入了解的读者可以通过项目主页https://tianzhechu.com/SFTvsRL获取完整论文信息。

想象你面前有两个孩子在学数学,一个死记硬背乘法表,考试时只要题目稍有变化就抓瞎;另一个真正理解了乘法原理,遇到新题型也能触类旁通。这就是当前AI训练中的一个根本性问题——我们的AI到底是在"死记硬背"还是在"真正学习"?

长期以来,训练AI就像教育孩子一样,主要有两种方法:一种叫做监督微调(SFT),就像传统的填鸭式教育,给AI看大量标准答案,让它模仿;另一种叫做强化学习(RL),更像启发式教育,让AI在尝试中学习,做对了给奖励,做错了给惩罚。但是这两种方法哪种更能让AI真正"开窍",一直是个未解之谜。

研究团队就像教育专家一样,设计了精巧的实验来探究这个问题。他们创建了一个类似"算24点"的数学游戏,给AI四张卡片,让它用加减乘除算出24这个数字。更巧妙的是,他们还设计了不同

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

售30万?方程豹钛7高配版有激光雷达/车载无人机

网易汽车 浏览 9468 07-19

初秋第一条连衣裙,这20件巨显瘦!

Yuki女人故事 浏览 324 09-11

女子产后抑郁自缢骨灰被丈夫私自下葬 父母苦寻四年

新民晚报 浏览 261 12-11

小米SU7换代,或涨价2万元,都会有哪些升级?

正在说车 浏览 287 12-19

中国最赚钱航司答案揭晓 民航业开启“反内卷”

上观新闻 浏览 509 08-16

本场16罚!斯潘:字母哥本应获得更多罚球 他每场少罚了4-6个

直播吧 浏览 461 09-10

森亿智能冲刺港股:上半年营收1.1亿亏损9746万 腾讯红杉是股东

雷递 浏览 374 10-02

韩特检组:尹锡悦试图通过无人机事件诱使朝鲜进攻韩国

界面新闻 浏览 1163 07-05

上天的小鼠为何更瘦?这场跨年科学对话透露了很多航天趣事|科学家·马上回答

封面新闻 浏览 261 01-02

脱口秀演员杨笠清空社交账号 她到底经历了什么?

代军哥哥谈娱乐 浏览 315 11-05

福建舰、山东舰、辽宁舰 作战能力不止“1+1+1”

上观新闻 浏览 258 11-14

杭州多个小区自来水有异味 当地水务:将赔偿5吨水费

封面新闻 浏览 2632 07-18

百色"锅底"村庄积水不退 村民:明年不想再种地 白费劲

澎湃新闻 浏览 343 10-24

缅甸政府将拆除KK园区148栋建筑,其中包括KTV、医院和SPA会所,已拆除101栋

红星新闻 浏览 293 11-10

比亚迪第五代DM技术实现能效突破 亏电油耗降至2.6L

经济观察报 浏览 1139 08-07

这才是真正的欧美赛车片,成功把观众拉回影院,完美体验灵魂出窍

最爱酷影视 浏览 3492 07-10

媒体:黄杨钿甜"耳环"事件 一场质疑与谣言苟合的闹剧

潇湘晨报 浏览 1938 07-17

裸辞的年轻人,把尼泊尔躺成大理「平替」

36氪 浏览 4183 07-27

E句话|他的女朋友们,都是被他妈妈赶走的?

仙女事件簿 浏览 2991 07-08

夫妻靠编藤椅把儿子培养成浙大硕士:手指纹都磨没了

都市快报橙柿互动 浏览 8246 07-21

标配倍适登EDC减震器 岚图FREE+底盘信息曝光

网易汽车 浏览 516 06-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11