关闭广告

AI大模型"减肥"新突破:MWS AI团队让语言模型变小却更聪明

科技行者2025-10-22 00:00:0297人阅读


这项由MWS AI公司和ITMO大学联合完成的研究发表于2025年10月,论文编号为arXiv:2509.22075v2。研究团队包括来自MWS AI的Dmitriy Shopkhoev、Denis Makhov、Magauiya Zhussip和Stamatios Lefkimmiatis,以及来自ITMO大学的Ammar Ali。有兴趣深入了解的读者可以通过该论文编号查询完整研究报告。

现在的大型语言模型就像一台超级智能的机器,能够回答各种问题、写文章、翻译语言,但有一个大问题:它们实在太"胖"了。这些模型需要占用大量的计算机内存和处理能力,就像一辆装满行李的重型卡车,虽然功能强大,但开起来费油又缓慢。对于想在手机、平板电脑或者小型服务器上运行这些智能助手的人来说,这简直是个噩梦。

为了解决这个问题,研究人员们想出了各种"减肥"方法。最流行的一种方法叫做"低秩分解",可以把它理解为把一个复杂的大拼图拆解成几个简单的小拼图。但是这种方法有个致命缺陷:它假设所有的拼图碎片都必须遵循同一个模式,就像强制要求所有人都穿同一个尺码的衣服一样,结果往往是不合身的。

MWS A

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

大变局!盘活845万人的顶层棋局​曝光

大猫财经Pro 浏览 79 10-29

俄罗斯索契机场暂停起降航班

界面新闻 浏览 9386 08-11

大电池增程成风,车企在堆料自嗨?

帮宁工作室 浏览 33 11-14

问界M8纯电版开启预订:预售价37.8万元起,8月上市

IT之家 浏览 7358 07-25

AI杀入美股,DeepSeek又是第一!港大90后开源,AI股神人人都能造

新智元 浏览 88 10-26

蓉城海港连败0进球!为中超争冠大轮换,媒体人:亚冠毫无吸引力

奥拜尔 浏览 93 10-22

肥胖:健康之敌与轻断食减肥法

浏览 964 07-14

美防长来了 核潜艇议题搅动韩国

环球网资讯 浏览 56 11-05

芯片圈“大佬”IPO梦碎,牵出千万受贿案!

野马财经 浏览 94 10-22

报道称明年AI芯片产量拟提高两倍,寒武纪尾盘拉升,深夜“严正声明”:不实

华尔街见闻官方 浏览 17 12-05

今天 | 送别杨振宁!群众含泪相送!队伍望不到头!

天津广播 浏览 75 10-24

他是著名演员,临终前也没听到儿子喊声爸?

妙知 浏览 99 10-17

丝袜遭质疑享受赛程特权!吉尔伯特:不用看都知道她比赛在早场

网球之家 浏览 289 08-19

天禧AI 3.5正式亮相,超级互联3.0首次打破全生态壁垒

环球网资讯 浏览 78 11-01

吴昕:恣意听风

时尚COSMO 浏览 168 09-13

小米汽车:小米YU7率先支持Wi-Fi 7上车

三言科技 浏览 6131 08-06

我们活在怎样的AI时代,文学可以拿出“像样的答案”

文汇报 浏览 174 09-09

美海岸警卫队110年来最大毒品案:缴获3.4万公斤

红星新闻 浏览 249 08-28

功能卡片自定/语控升级 捷途山海T2 OTA全新升级

网易汽车 浏览 272 05-10

泽连斯基被指已确认乌克兰新总理人选

界面新闻 浏览 3256 07-14

“送AI进企业”服务数千名职工,破解培训最后一公里难题

南方都市报 浏览 5067 07-28
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11