关闭广告

Kimi深夜整活,开源了首个万亿参数模型

网易科技报道2025-07-13 00:00:015930人阅读

7月11日晚,月之暗面宣布正式发布新一代基础模型 K2,并同步开源。该模型采用稀疏激活(MoE)架构,总参数1T,激活参数32B。

据悉,Kimi K2具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,在 SWE Bench Verified、Tau2、AceBench 等多个权威基准测试中取得当前开源模型中的最佳成绩(),在数学推理与复杂任务理解方面也表现优异。


据介绍,该模型训练过程中采用 MuonClip 优化器,有效解决大参数量模型的稳定训练问题,提升 token 利用效率,在优质数据稀缺的背景下进一步拓展 Scaling 上限。

技术上,Kimi K2结合大规模 Agentic Tool Use 数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是构建通用 Agent 的关键基石,未来还将加入思考与多模态能力。

目前,Kimi K2模型已集成至 Kimi App 与官网平台,并提供 API 接入服务。API 兼容 OpenAI 与 Anthropic 的 Chat 接口,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

揭秘打呼噜和肥胖的关系

网易健康 浏览 6262 02-26

AI百人榜刷屏,小扎照单全收?辛顿Ilya师徒霸榜,第二名竟是本科生

新智元 浏览 8536 07-31

又到每年假装自己是汤唯的时候了

时尚COSMO 浏览 241 10-15

男子为女儿买房花30万装修 如今却站在门口不敢进去

1818黄金眼 浏览 447 09-29

万马股份:国产电缆料破局者,助力能源基建大国重器

览富财经网 浏览 8144 07-25

推动人工智能等产学研融合——中国移动广西公司联合共青团广西区委、多所高校出实招

环球网资讯 浏览 7789 08-10

世界首台,我国 660 兆瓦超超临界双拱型燃煤机组全面投运

IT之家 浏览 416 09-01

本轮牛市买什么,推荐5个方向

星图金融研究院 浏览 1796 08-12

51岁林志玲近状曝光,面相变化大引热议,网友:变成莫文蔚了

扒虾侃娱 浏览 195 01-15

10天9涨停!又一超级大妖股彻底爆了

财经锐眼 浏览 260 10-25

空客H160直升机在中国正式投入运营

界面新闻 浏览 2387 08-13

频刷纪录 金价有望再战年内高点

北京商报 浏览 344 09-10

医院布局大模型很热闹,缘何还难以真正落地

第一财经资讯 浏览 1337 07-25

时速超25公里自动断电,电动自行车新国标9月1日实施!探访:有门店库存最高涨价500元,新国标车暂未到货

红星新闻 浏览 380 09-01

在澳洲开库里南的杨兰兰,与铁矿石有关?

财通社 浏览 3427 08-10

中使馆:在以中国公民尽快陆路离境

新京报 浏览 10131 06-17

男生636分报民办新校福耀科技大学:赌输最差去玻璃厂

大象新闻 浏览 5629 07-23

成都外国语学校被传"天价学费没人报" 校方:严重失实

红星新闻 浏览 2797 07-18

近五场与富勒姆的联赛交手中,曼联取得4胜1负

懂球帝 浏览 399 08-24

“关税休战”延期90天,对中美贸易意味着什么?

环球网资讯 浏览 1045 08-13

"最快女护士"张水华获得"复出"后首个全马冠军

纵览新闻 浏览 248 11-03
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11