关闭广告

香港中文大学突破AI训练难题:单个词汇也能让机器学得更聪明

科技行者2025-10-28 00:00:01289人阅读


这项由香港中文大学的明瑞、吴昊原团队与华为诺亚方舟实验室、ChatEDA科技公司合作完成的研究,发表于2025年9月的arXiv预印本平台(论文编号:arXiv:2509.26313v1)。对于关心人工智能发展的普通读者来说,这项研究解决了一个听起来很技术但实际影响深远的问题:如何让AI更好地学习和泛化知识。

当我们教孩子学习时,有两种不同的方式。第一种是让孩子反复抄写标准答案,这就像传统的监督微调方法,孩子能够完美复制,但遇到新问题时往往不知所措。第二种是让孩子在实际练习中摸索,从错误中学习,这就像强化学习,虽然过程曲折,但孩子最终能举一反三。研究团队发现,第二种方法之所以更有效,关键在于孩子是在"真实练习"中学习,而不是只从固定的教材中死记硬背。

基于这个洞察,研究团队开发了一种名为"单词汇滚动"的新训练方法。这种方法巧妙地将两种学习方式的优点结合起来,既保持了第一种方法的高效性,又获得了第二种方法的泛化能力。核心创新在于将AI生成每个词汇的过程都视作一次完整的学习机会,而不是等到生成完整句子后再进行评估。

研究团队在数学推理、代码生成和通用推理等多个领域进行了广

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"最强大脑"齐聚临港 上海正搭建未来科学共同体

看看新闻Knews 浏览 210 10-26

央视:杨瀚森已经确认归队,将很有可能现身此次热身赛

懂球帝 浏览 4375 07-24

湘超联赛赛程出炉:共13轮联赛,12月6日结束,前8晋级淘汰赛

懂球帝 浏览 339 09-11

刘亦菲慷慨捐款150万助力香港,助力灾后重建与心理支持

茶韵浮生 浏览 198 12-02

羽田机场安检员涉嫌盗窃被逮捕

环球网资讯 浏览 324 09-16

许凯赌博风波升级!警方回应已关注此事,律师解读许凯涉嫌赌博罪

萌神木木 浏览 318 09-09

马克龙透露约20国将组建"威慑部队" 以保障乌克兰安全

看看新闻Knews 浏览 358 11-27

比利亚雷亚尔vs阿拉维斯:阿约塞-佩雷斯、帕雷霍首发,阿莱尼亚、洪尼-奥托出战

懂球帝 浏览 187 01-11

6名大学生殒命,涉事企业却曾是安全“典范”

虎嗅APP 浏览 8693 07-26

女子误触氢氟酸身亡事发地被围 丈夫:砸钱没能救回她

极目新闻 浏览 380 09-21

L4级自动驾驶到来之际,奔驰还要继续领先

汽车公社 浏览 196 12-16

哈兰德自2022-23赛季起英超对阿森纳打进5球,同期所有球员最多

直播吧 浏览 299 09-22

半年亏损 5800 万仍闯港交所!复星医药分拆安特金图啥?

野马财经 浏览 257 11-06

“得黄金ETF者得天下”!这类ETF单周狂揽410亿元,两家公募成大赢家丨ETF规模周报

每经牛眼 浏览 289 10-19

港女最爱的国产单品,赢了特斯拉?

新周刊 浏览 210 11-27

皇马2-0!开局5连胜领跑西甲,姆巴佩世界波+5场5球,米利唐破门

侃球熊弟 浏览 328 09-21

法拉第未来官宣10月8日交付下一台 FF 91 2.0 Futurist Alliance

IT之家 浏览 348 09-26

贵州茅台的盈利会下降吗?

锦缎研究院 浏览 190 01-06

内外焕新/新中式设计 全新博越造型曝光 8月正式上市

网易汽车 浏览 8991 07-18

AI编程终于“开箱即用”了?Qwen3-Coder或许是那个质变节点

硅星人 浏览 10576 07-24

前“孝感首富”再融资,旗下“百亿”大洋电机遭专利诉讼

阿尔法工场 浏览 309 09-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11