关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者2025-08-27 00:00:01369人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

寻找隐形冠军|意想不到的它

海外网 浏览 126 01-07

比亚迪宣布涨价!

江南晚报 浏览 7 04-29

女子患小脑萎缩症加重 前男友复合帮她完成100个心愿

极目新闻 浏览 209 11-25

娃哈哈董事长宗馥莉卷入150亿遗产大战!被3名“同父异母弟妹”起诉

黑池财经 浏览 1548 07-14

乾崑ADS3.3上线 豹8第四次OTA升级

网易汽车 浏览 747 07-06

中俄联演 中方现役主战舰艇齐发

极目新闻 浏览 1069 08-10

1700亿龙头巨额定增并赴港IPO,股东高管却纷纷减持

尺度商业 浏览 9956 08-07

恭喜!浙江队外援卢卡斯社媒晒照,与妻子迎来二胎

直播吧 浏览 1573 07-16

伊朗庆祝战胜以色列 此前被传阵亡的高级军官现身

红星新闻 浏览 871 06-26

3名高中生赴西双版纳后失联 湖北黄冈警方通报

界面新闻 浏览 4361 07-17

姚笛疑似坐文章副驾?再回看当年

二月侃事 浏览 448 08-12

特朗普宣布对欧洲八国加征关税 外交部回应

财联社 浏览 190 01-20

900亿徐州国企一哥,再任命80后高管,人均薪酬超过25万元

华美财经 浏览 1384 07-15

姜诚最新访谈!投资是逆人性修行,过程必然伴随煎熬

一地基毛 浏览 758 08-10

披着“仙侠”皮的《现代牛马生存记》

时尚COSMO 浏览 391 08-19

"俄罗斯外籍院士、苏辙后人"被打假 33亿项目正注销

澎湃新闻 浏览 532 08-18

因串通投标,和普威视子公司被暂停其参加军队相关采购活动资格

红星资本局 浏览 1000 07-17

罗体:葡体坚持对尤尔曼德的要价,奥赖利的顺位在尤文心中上升

懂球帝 浏览 498 08-11

方正通透/视野开阔 方程豹钛7内饰官图曝光

网易汽车 浏览 6445 07-27

世锦赛女子100米自由泳预赛:程玉洁第8、吴卿风第14,晋级半决赛

直播吧 浏览 871 07-31

今夜,见证历史!全线暴涨!

券商中国 浏览 332 09-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11