关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者2025-08-27 00:00:01374人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

联合国启动下任秘书长遴选 三大热门人选亮相

红星新闻 浏览 351 11-27

下周关注|进博会等多个重要活动将举办, 这些投资机会最靠谱

第一财经资讯 浏览 259 11-03

享界S9旅行版定名S9T 以科技作答大尺寸“瓦罐”

网易汽车 浏览 937 07-18

落石砸车致司机身亡家属向政府索赔百万 遗体尚未安葬

极目新闻 浏览 6669 07-14

两中国游客穿泳衣失联 失联女生对父母说是与发小出游

红星新闻 浏览 348 10-09

东北大学遇难学生母亲来接孩子 一人衣着朴素被人搀扶

火山诗话 浏览 3764 07-26

送"游戏本"还附带游戏说明 上科大本科录取通知书火了

封面新闻 浏览 10343 07-26

iCAR苏峻:我们不做夹生饭,不造速生车

网易汽车 浏览 181 12-10

五年后,中国只剩10%的汽车公司财务健康

汽车公社 浏览 6007 07-08

罗马诺:拜仁本周多次致电了解情况,西蒙斯仍最可能去切尔西

懂球帝 浏览 10498 07-27

丰田员工解释公司数字化转型为何“转”不动:墨守成规

IT之家 浏览 2471 07-29

恩里克:萨福诺夫是我执教过的最擅长点球预判的门将

懂球帝 浏览 155 02-02

坦克品牌销量罕见下滑,长城汽车如何守擂?

尺度商业 浏览 4557 07-13

量子计算优秀成果案例发布 第四届CCF量子计算大会在成都开幕

封面新闻 浏览 2757 07-22

美国一错再错!搞不好,要丢失霸权

浏览 2893 07-14

24岁小伙深夜聚餐当场吐血 医生从他肺部取出一枚笔帽

环球网资讯 浏览 189 01-18

秒级定位光网络故障,中国移动用AI判断光纤中断、接口松动等问题

IT之家 浏览 346 10-02

苹果携手剑桥大学设计最佳 AI 评审框架,突破复杂任务评审局限

IT之家 浏览 5176 07-24

巴基斯坦空军发布最新宣传片 歼-10C成绝对主角

看看新闻Knews 浏览 372 09-10

销量持续回暖,谁说燃油车不行了?

汽车公社 浏览 311 10-14

上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

IT之家 浏览 153 02-05
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11