关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者2025-08-27 00:00:01470人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

阿联酋航空开通迪拜—杭州直飞航班 每日运营一班

北京商报 浏览 5722 07-31

300亿光伏巨头捷佳伟创,遭高管股东集体减持

侃见财经 浏览 441 09-09

极石ADAMAS将于12月28日上市

天天电动 浏览 228 12-21

38岁后单赛季为意甲升班马攻入至少4球,瓦尔迪是历史第二人

懂球帝 浏览 283 12-02

歼-20S将彻底改变未来战场

环球时报新闻 浏览 454 09-04

开拓者高管:杨瀚森将带来很大帮助 这可能比多数人预期的都要快

直播吧 浏览 9974 07-25

阿里26周年,马云发狠了

无冕财经 浏览 484 09-11

星空相册|天宇上演木星伴弦月

新华社 浏览 354 10-14

2027年!关键技术将取得突破

中国基金报 浏览 3015 08-10

前华为升腾总裁许映童创办的思格新能源冲刺港股:4个月营收12亿

雷递 浏览 415 09-09

Lovart正式发布推出ChatCanvas,想挑战Figma和Canva?

硅星人 浏览 7012 07-25

李强主持召开国务院常务会议 审议通过《“三北”工程总体规划》

新华社 浏览 519 08-23

西方媒体炒作“伊朗加速生产导弹”

环球网资讯 浏览 296 11-14

拉基蒂奇万字退役专访⭐️梅西的魔力 MSN的遗憾 巴萨已经回来了

直播吧 浏览 1027 07-13

大鹏自曝《长安的荔枝》本想让李雪琴演杨贵妃

韩小娱 浏览 5142 07-24

俄外长支持中国为乌提供安全保障 俄学者:西方怕极了

澎湃新闻 浏览 675 08-23

外骨骼机器人向消费级市场拓展,傲鲨智能张华:未来它将像手机一样普及

红星资本局 浏览 577 08-11

以伊冲突第4日德黑兰街头冷清 加油站成唯一"热闹"场所

上观新闻 浏览 7279 06-18

郑丽文当选提三大原则 称绝不让台湾成为"麻烦制造者"

海峡导报社 浏览 364 10-19

B级车杀入八万元区间,汽车的价格战到底路在何方?

江瀚视野 浏览 403 10-14

2025世界青年科学家峰会聚焦开放合作

新华社 浏览 341 10-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11