关闭广告

Kimi深夜整活,开源了首个万亿参数模型

网易科技报道2025-07-13 00:00:015433人阅读

7月11日晚,月之暗面宣布正式发布新一代基础模型 K2,并同步开源。该模型采用稀疏激活(MoE)架构,总参数1T,激活参数32B。

据悉,Kimi K2具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,在 SWE Bench Verified、Tau2、AceBench 等多个权威基准测试中取得当前开源模型中的最佳成绩(),在数学推理与复杂任务理解方面也表现优异。


据介绍,该模型训练过程中采用 MuonClip 优化器,有效解决大参数量模型的稳定训练问题,提升 token 利用效率,在优质数据稀缺的背景下进一步拓展 Scaling 上限。

技术上,Kimi K2结合大规模 Agentic Tool Use 数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是构建通用 Agent 的关键基石,未来还将加入思考与多模态能力。

目前,Kimi K2模型已集成至 Kimi App 与官网平台,并提供 API 接入服务。API 兼容 OpenAI 与 Anthropic 的 Chat 接口,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"困在轮椅上"的女孩在音乐节被高高举起:我好像重生了

上游新闻 浏览 5019 06-13

宁德时代:上半年归母净利润同比增长33.02%

网易财经 浏览 2929 07-31

搭载OPPO智行车机系统 全新MG4正式量产下线

上观新闻 浏览 5881 07-24

赵薇母女现身机场,15岁小四月身高近170

疯说时尚 浏览 3696 07-27

退出演艺圈10年,“婉瑜”赵霁分享近况

八斗小先生 浏览 7021 07-26

阿里国际AI解决方案Marco获世界人工智能大会SAIL之星

观察者网 浏览 180 07-27

毕马威:人工智能已成为推动中国产业升级与经济高质量发展的关键驱动力

澎湃新闻 浏览 2962 07-28

开会新体验:微软 Teams 公测沉浸式 3D 环境功能

IT之家 浏览 3762 07-29

记者谈国足:现在和强队遭遇,连幻想赢的底气都没了

直播吧 浏览 6633 07-13

英伟达H20芯片出口许可获批

北京商报 浏览 4899 07-16

金价持续调整,投资者该入局吗?

国际金融报 浏览 1784 07-13

机器人、AI与“黑灯工厂”——从粮交会看中国粮食产业智能跃迁

新华社 浏览 5276 07-14

上海、浙江沿海将遭遇海啸与台风双重灾害影响

澎湃新闻 浏览 2922 07-31

美政府大幅削减NASA预算 41项科研项目或被终止

环球网资讯 浏览 3687 06-11

“雷佳音现象”遭抵制!官媒发声,张译被牵连

乡野小珥 浏览 5341 07-11

泰国前副总理:中方多次建议都不听 现在为时已晚

澎湃新闻 浏览 191 07-11

特朗普:将签署行政令 药价几乎可"立降30%至80%"

界面新闻 浏览 1482 05-12

牺牲师父,抛妻弃子,《扫毒风暴》卢少骅彻底黑化!

电和影 浏览 6697 07-20

斯洛特:迪亚斯正在进行转会谈判,所以没有在友谊赛出场

懂球帝 浏览 9323 07-27

华侨银行集团最新任命!陈德隆接替黄碧娟出任CEO

21金融圈 浏览 352 07-15

曼联4-1伯恩茅斯,多古传射,霍伊伦建功,19岁小将威廉斯破门

懂球帝 浏览 4516 07-31
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11