关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者2025-08-27 00:00:01467人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今年冬天最火搭配:毛衣+毛衣,放松穿更好看!

LinkFashion 浏览 192 11-27

球场宣!洛杉矶FC主场大屏幕“官宣”:欢迎孙兴慜!洛杉矶FC前锋

直播吧 浏览 5172 08-06

万科巨变,组织架构调整尘埃落定

YOUNG财经 浏览 472 09-02

曝WCBA两冠王内蒙古女篮或解散 媒体人列4证据连续缺席两项大赛

醉卧浮生 浏览 560 08-22

天,他竟瘦成美男子了!

文艺馆 浏览 350 09-06

霍瑞戎履新上交所副理事长 曾任证监会国际合作司司长

21金融圈 浏览 397 09-11

“青云租”爆雷员工揭内幕:每个员工每月需投资30台手机,11万台集中流向两个村庄

封面新闻 浏览 284 11-10

民航版12306来了 航旅纵横上线“民航官方直销平台”

潇湘晨报 浏览 4863 07-25

吉利汽车半年报:营收首破1500亿 核心归母利润猛增102%

网易汽车 浏览 535 08-15

篮网的痛!蒂格谈21年半决赛G7:我亲身经历过最好的一场比赛

直播吧 浏览 7653 08-10

傍上 “新中式”,现制酸奶能迎来 “二次爆发” 吗?

餐饮老板内参 浏览 372 10-13

换上高尔夫GTI同款2.0T动力 新凌渡L GTS实车曝光

网易汽车 浏览 556 05-30

推广|| 被刘亦菲、辛芷蕾种草的宝藏单品,确实很好搭!

黎贝卡的异想世界 浏览 362 10-22

追梦:篮网27号秀是“犹太约基奇”?是个人就是小约基奇啊

懂球帝 浏览 186 12-11

如今,领导班子责任落实,成了老大难

识局 浏览 307 11-06

帧帧美若油画,库布里克大神杰作告别放映!

幕味儿 浏览 286 01-18

上海女子崩溃了:男邻居楼道内一丝不挂 还猛砸自家门

看看新闻Knews 浏览 533 09-09

王化回应网传"小米前总监"大瓜:该人曾入职小米食堂

鲁中晨报 浏览 847 06-28

芬兰将举行多场联合军演 俄芬关系再度紧张

国际在线 浏览 320 11-04

10年股权拉锯战将落幕?西藏发展要“赎身”拉萨啤酒,嘉士伯套现离场倒计时

时代周报 浏览 1599 07-25

股市火爆!上市公司豪掷30亿炒股

网易财经 浏览 547 08-12
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11