关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者2025-08-27 00:00:01209人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美禁售C919发动机 中航西飞:不影响生产

界面新闻 浏览 1648 06-05

库克继续押宝印度制造 一手在印度扩产一手安抚特朗普

时代周报 浏览 272 08-22

莲花中国加速发力,2025二季度销量同比增长31%

网易汽车 浏览 4845 07-04

AI“竞岗”华尔街高端职位?高盛聘用AI程序员:不吃不睡,效率提高三四倍

红星新闻 浏览 7058 07-14

美军在加勒比地区袭击船只致6人死亡 包括两名特多公民

环球网资讯 浏览 115 10-17

程帅澎20分获MVP:轰5三分平约旦全队 三战46+10三分成头号射手

醉卧浮生 浏览 6322 08-10

女教师在闺蜜群聊"八卦"被认定诽谤遭行拘 当事人发声

红星新闻 浏览 196 09-20

预计1亿欧图片报:利物浦已告知法兰克福 愿支付埃基蒂克要价

直播吧 浏览 1685 07-18

业主私挖300平地下室:白天用挖机挖 半夜偷偷运土

扬子晚报 浏览 106 10-14

二季度全球GPU销量7470万块!NVIDIA揽下更多份额

快科技 浏览 217 09-01

38岁的陈晓让整个娱乐圈“沉默”了?

包饺子ai剪辑 浏览 28 11-27

诺诚健华发布半年报:营收增74%,单品依赖或待破局!年内股价涨超140%

时代周报 浏览 270 08-21

医疗暂停当盘外招?张本智和回应争议:王楚钦离场换衣服我也没说

我爱英超 浏览 342 08-12

记者:马竞正与斯图加特中场米洛谈判,后者合同含2000万欧解约金

直播吧 浏览 4187 07-27

特朗普透露俄乌领导人会晤计划细节:已"大致安排好"

环球网资讯 浏览 320 08-20

姑姑霸占侄女房住近10年 村委:姑姑一家分了540平房子

极目新闻 浏览 301 08-21

男子去世存款只剩7.5元留下满屋假古董 妻子崩溃落泪

环球网资讯 浏览 307 08-25

吉利星座第四轨卫星发射 中国民营“星链”将建成

网易汽车 浏览 4151 08-10

300多韩国工人在美被关押细节:双手被绑 喝水靠舔

红星新闻 浏览 259 09-18

普京与金正恩通电话

新京报 浏览 7239 08-13

记者:本周五泰山队代理主帅韩鹏和球员于金永出席赛前发布会

懂球帝 浏览 5235 08-07
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11