关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者2025-08-27 00:00:01469人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

为什么山系火锅不排队了?

互联网那些事 浏览 193 01-11

英特尔宣布,57亿美元到账,投资者先炸了

网易科技报道 浏览 517 08-29

官方:中甲辽宁铁人新增一条转会禁令,为期三个转会窗

懂球帝 浏览 7244 07-24

太狠了!奥特曼亲手「干掉」GPT-5.2,OpenAI祭出最强编程AI

新智元 浏览 238 12-19

收评:创业板指高开高走涨2.29% 黄金概念股集体大涨

财联社 浏览 550 09-02

比亚迪长城“交卷”,谁都不是“恒大”

字母榜 浏览 423 09-02

迎来新行长,挥别董事长,浙商银行风雨交接班?

节点财经 浏览 2397 07-15

回顾沃尔奇葩受伤:在家中滑倒导致左脚跟腱断裂 因此缺阵12个月

直播吧 浏览 449 08-20

GPT-5不及预期,但给OpenAI喂数据的公司却身价暴涨

虎嗅APP 浏览 572 08-11

涉嫌在英首相住宅纵火男子被正式起诉

浏览 7855 07-14

中国男篮vs约旦前瞻:能否3连胜直通八强?若输球恐跌至小组二三

醉卧浮生 浏览 2408 08-09

美国大学生就业遇冷,主要怪AI?

国际金融报 浏览 2031 07-30

吉利银河M9申报图曝光!拥有5205mm的车长

汽车网评 浏览 518 06-23

新加坡总理:台湾问题是"中国红线中的红线"

澎湃新闻 浏览 528 09-21

天空体育:苏超流浪者与海港主帅穆斯卡特谈判已进入最后阶段

懂球帝 浏览 340 10-17

阿莫林更衣室怒骂曼联球员,直言愤怒失望!基恩炮轰红魔如小学生

罗米的曼联博客 浏览 328 12-05

一塌再塌!36岁檀健次与大二女生谈恋爱,他的高跟鞋就是锤

严肃八卦 浏览 267 01-08

中方是否愿在俄乌和平协议中提供安全保障 外交部回应

外交部网站 浏览 603 08-20

特朗普:格陵兰岛仅靠狗拉雪橇进行防卫

环球网资讯 浏览 269 01-13

“移动崩了”?上班无法打卡?北京移动致歉

北青网-北京青年报 浏览 6595 08-13

印度主帅:没人会觉得我们能赢中国队 但每场硬仗都是锻炼的机会

直播吧 浏览 6941 08-07
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11