关闭广告

Kimi深夜整活,开源了首个万亿参数模型

网易科技报道2025-07-13 00:00:016030人阅读

7月11日晚,月之暗面宣布正式发布新一代基础模型 K2,并同步开源。该模型采用稀疏激活(MoE)架构,总参数1T,激活参数32B。

据悉,Kimi K2具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,在 SWE Bench Verified、Tau2、AceBench 等多个权威基准测试中取得当前开源模型中的最佳成绩(),在数学推理与复杂任务理解方面也表现优异。


据介绍,该模型训练过程中采用 MuonClip 优化器,有效解决大参数量模型的稳定训练问题,提升 token 利用效率,在优质数据稀缺的背景下进一步拓展 Scaling 上限。

技术上,Kimi K2结合大规模 Agentic Tool Use 数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是构建通用 Agent 的关键基石,未来还将加入思考与多模态能力。

目前,Kimi K2模型已集成至 Kimi App 与官网平台,并提供 API 接入服务。API 兼容 OpenAI 与 Anthropic 的 Chat 接口,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普将宣布对乌军援新计划 或包括进攻性武器

环球网资讯 浏览 1403 07-15

每体:腓骨骨折的邦马蒂将接受手术,或将伤缺5个月

懂球帝 浏览 256 12-02

粉丝给艺人当辩护律师,还住一起了,这也行?

伊周潮流 浏览 241 01-10

大众全新“重磅”SUV将首发!新外观+内饰,国产卖多少合适?

网上车市 浏览 3494 08-13

60年首次4200万美国人"断粮" 特朗普:快打民主党电话

红星新闻 浏览 352 11-04

上汽联手华为的尚界发布在即,尚界能给上汽带来什么?

江瀚视野 浏览 527 08-23

西安通报"水管高空坠落砸中婴儿车":婴儿仍在救治中

极目新闻 浏览 6262 08-13

“阔腿裤+薄底鞋”今年夏天太火了!时髦松弛又好看

LinkFashion 浏览 10245 07-29

精酿啤酒进入“战国时代” 五粮液、珍酒跨界入局

中国经营报 浏览 8040 08-10

或命名星光560 五菱宏光侠量产版实车曝光

车质网 浏览 284 12-02

辽宁男篮四外援出炉:威尔斯莫兰德布朗之外 奥利弗大概率回归

醉卧浮生 浏览 399 09-21

腾势D9将迎来第30万辆交付

大象新闻 浏览 268 11-27

疑似黄燕铭闭门观点流出:银行接近尾声,创新药或像过去10年新能源

金石随笔 浏览 9285 08-10

以伊冲突第4日德黑兰街头冷清 加油站成唯一"热闹"场所

上观新闻 浏览 7277 06-18

营收翻倍+亏损收窄!广东导远自研智驾定位系统,能否凭硬核技术闯关港股?|港E声

时代周报 浏览 264 01-07

被特朗普要求“立即下课”,英特尔CEO回应

观察者网 浏览 2836 08-09

京东外卖的“后招”,刘强东要“开灶” | 外卖大战

伯虎财经 浏览 3337 07-28

老板授意保安殴打他人致死一审被判无罪 检方提起抗诉

环球网资讯 浏览 1423 08-10

汕头两"世仇村"迎来世纪大和解:清末因抢水发生械斗

极目新闻 浏览 380 10-02

欧洲联军派几十个人的小分队到格陵兰 媒体:大有作用

看看新闻Knews 浏览 291 01-16

100坦克首次亮相 解读来了

环球时报新闻 浏览 458 09-04
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11