关闭广告

Kimi深夜整活,开源了首个万亿参数模型

网易科技报道2025-07-13 00:00:015926人阅读

7月11日晚,月之暗面宣布正式发布新一代基础模型 K2,并同步开源。该模型采用稀疏激活(MoE)架构,总参数1T,激活参数32B。

据悉,Kimi K2具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,在 SWE Bench Verified、Tau2、AceBench 等多个权威基准测试中取得当前开源模型中的最佳成绩(),在数学推理与复杂任务理解方面也表现优异。


据介绍,该模型训练过程中采用 MuonClip 优化器,有效解决大参数量模型的稳定训练问题,提升 token 利用效率,在优质数据稀缺的背景下进一步拓展 Scaling 上限。

技术上,Kimi K2结合大规模 Agentic Tool Use 数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是构建通用 Agent 的关键基石,未来还将加入思考与多模态能力。

目前,Kimi K2模型已集成至 Kimi App 与官网平台,并提供 API 接入服务。API 兼容 OpenAI 与 Anthropic 的 Chat 接口,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

恒丰银行重庆分行被罚260万元,3名责任人被警告

派财经 浏览 431 08-22

因其出色带队表现和为科莫吸引游客,法布雷加斯获奖

懂球帝 浏览 1529 07-22

厄德高谈晋级世界杯:这种感觉无法用语言形容,简直疯狂至极

懂球帝 浏览 232 11-17

印度硬刚美国也要买俄石油背后:进口1吨省下89美元

时代周报 浏览 486 08-23

2026款奔驰GLC AMG 43 4MATIC上市 售58.9万

车质网 浏览 186 10-23

村干部吃喝"打白条" 饭店老板二十多年未要回20万饭钱

民生周刊 浏览 409 08-18

鲁比奥"插队"与王毅会面 态度180度转变后又恢复本色

博览历史 浏览 1586 07-15

AI Startup 招聘集市|银河通用正在寻找具身智能的下一位 Builder

硅星人 浏览 2173 07-25

mini版LABUBU将发售,79元一个,抽隐藏款概率为1/168

红星资本局 浏览 442 08-23

朱媛媛去世后辛柏青首露正脸,眼神空洞憔悴

胡一舸南游y 浏览 186 10-31

何广智,太反人性

周一叨 浏览 390 09-02

雷军被人堵在车里维权?小米高管回应

电动知家 浏览 32 04-20

罗德里:我不是梅西,不能一回来就让球队不断赢球

懂球帝 浏览 386 09-01

奥运"双冠王"达尔迈尔在巴基斯坦登山时遇难 年仅31岁

极目新闻 浏览 7291 07-31

美国CIA发布视频"招募中国官员窃取机密" 外交部回应

外交部网站 浏览 7802 05-07

爱康集团起诉"体检10年未见异常却患癌"女子:确认无责

界面新闻 浏览 8456 07-30

特朗普开价10亿美元招募 被指试图用新机构替代联合国

极目新闻 浏览 212 01-18

罗马仕及相关公司遭起诉追讨1.36亿元

红星新闻 浏览 339 09-04

来搞笑的?超级杯花名册漏洞百出:照片古早且粗糙,译名叠词

懂球帝 浏览 120 03-03

万科开启了第二笔中票展期

国际金融报 浏览 194 12-19

销量翻五倍!头部餐饮“暗暗抢购”炒菜机器人

餐饮老板内参 浏览 421 08-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11