关闭广告

Kimi深夜整活,开源了首个万亿参数模型

网易科技报道2025-07-13 00:00:016029人阅读

7月11日晚,月之暗面宣布正式发布新一代基础模型 K2,并同步开源。该模型采用稀疏激活(MoE)架构,总参数1T,激活参数32B。

据悉,Kimi K2具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,在 SWE Bench Verified、Tau2、AceBench 等多个权威基准测试中取得当前开源模型中的最佳成绩(),在数学推理与复杂任务理解方面也表现优异。


据介绍,该模型训练过程中采用 MuonClip 优化器,有效解决大参数量模型的稳定训练问题,提升 token 利用效率,在优质数据稀缺的背景下进一步拓展 Scaling 上限。

技术上,Kimi K2结合大规模 Agentic Tool Use 数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是构建通用 Agent 的关键基石,未来还将加入思考与多模态能力。

目前,Kimi K2模型已集成至 Kimi App 与官网平台,并提供 API 接入服务。API 兼容 OpenAI 与 Anthropic 的 Chat 接口,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

优衣库往事:如何在“下行周期”里逆行?

锦缎研究院 浏览 5682 07-29

塞门约:目前对种族歧视采取的措施远远不够,可以考虑判刑

懂球帝 浏览 529 08-23

五粮液前董事长李曙光被“双开”!卖酒类经销权牟利数额巨大,更多细节公布……

国际金融报 浏览 308 10-28

马筱梅北京开播!汪小菲沙发看电影!

二妹扯娱 浏览 478 08-26

《繁花》回应霸凌风波,避重就轻评论区翻车,网友要求王家卫道歉

萌神木木 浏览 389 09-21

汪小菲要把满月儿子绑在身上坐飞机?马筱梅急了

喜欢历史的阿繁 浏览 231 03-02

美乌领导人通电话 乌克兰空袭中度过“不眠夜”

环球网资讯 浏览 1458 07-05

记者:阿利松私人原因离开利物浦训练营,将在球队返英后归队

懂球帝 浏览 3570 07-29

暑期档、宗庆后、演唱会捉出轨、武大风波、释永信等

电影最TOP 浏览 1807 08-08

菲律宾将"变天"12万军队蓄势待发 中方泼了一盆冷水

南权先生 浏览 438 09-17

续航超600km 起亚EV4 Hatchback或引入国内

车质网 浏览 9793 07-04

31岁护士被同居男友杀害 父亲:女儿之前从没谈过对象

环球网资讯 浏览 2580 07-18

一家三口遭同村男子持刀砍死 凶手被鉴定为精神分裂

红星新闻 浏览 3571 06-29

梅赛德斯-奔驰推出纯电动超跑概念车

盖世汽车 浏览 5447 06-27

陈楚生爆冷拿下"歌王"后引争议:我也希望我是"皇"

红星新闻 浏览 9883 08-10

尹锡悦一周内两次拒捕 韩特检组拿他没办法:怕他受伤

上游新闻 浏览 3509 08-09

强调优势的吉利星愿,能否改写A0级市场的“野蛮迭代”

观察者网 浏览 364 10-14

金秋,穿最浪漫的裤子去散步

Yuki女人故事 浏览 413 08-21

"霉霉"官宣订婚:特朗普祝贺 其个人财富已达16亿美元

每日经济新闻 浏览 319 08-27

搭激光雷达/800V/6C快充 长安启源A06全球首秀

网易汽车 浏览 452 09-06

李在镕的抉择:撤离家电、加码存储,三星中国市场大“调仓”

华夏时报 浏览 132 05-09
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11