关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者2025-08-27 00:00:01210人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

瞬间暴跌40%,东方甄选到底怎么了?

财经锐眼 浏览 256 08-21

奥哈拉:森林的处理方式简直耻辱;吉布斯-怀特应该起诉并罢训

懂球帝 浏览 3567 07-18

德天空:大幅涨薪,努涅斯在利雅得新月每年将净赚1500万欧

懂球帝 浏览 2396 08-07

刘浩存的天终于亮了,张艺谋当初真的没有骗我们

小先生笔记 浏览 170 09-29

曝国民级女星老公出轨,她们纷纷躺枪

柠檬有娱乐 浏览 211 09-09

舒淇,东亚女孩的恨海情天

时尚COSMO 浏览 45 11-12

起拍价618万 抗日将领李默庵故居以2913万落槌成交

封面新闻 浏览 349 08-12

马伊琍大女儿晒暑假生活,跟阿姨学做牛腩煲

八怪娱 浏览 6325 07-28

官方:成都蓉城前外援、韩国前国脚金敃友加盟K2水原三星队

懂球帝 浏览 2888 07-25

周冠宇忆英国站事故:对我也是打击很大的一次,好在人是平安回归

直播吧 浏览 2333 08-13

WTT中国澳门冠军赛:向鹏2-3不敌弗朗西斯卡,止步男单首轮

直播吧 浏览 186 09-11

统一的“中年危机”或是伪命题!

互联网那些事 浏览 324 08-11

国庆长假,基层的你休了几天?

识局 浏览 121 10-11

实属罕见 美军工巨头主动披露最新无人僚机项目概念图

环球时报国际 浏览 160 09-23

最新官宣!这家公募总经理换人!

券商中国 浏览 2926 08-10

Kimi深夜整活,开源了首个万亿参数模型

网易科技报道 浏览 5773 07-13

加拿大航空空乘罢工持续 大量旅客滞留机场

北青网-北京青年报 浏览 247 08-19

多航司调整乘务员着装 网友:早该这样

新京报 浏览 5215 08-06

特斯拉 Model Y L 交流外供电适配器上架,售价 599 元

IT之家 浏览 44 11-10

小品类也能撬到大生意,谁成为商家的“赚钱搭子”?

陆玖商业评论 浏览 235 08-27

意大利男篮主帅:遇到一位拉脱维亚球员 他说字母哥简直是个野兽

直播吧 浏览 262 08-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11