关闭广告

Kimi深夜整活,开源了首个万亿参数模型

网易科技报道2025-07-13 00:00:015359人阅读

7月11日晚,月之暗面宣布正式发布新一代基础模型 K2,并同步开源。该模型采用稀疏激活(MoE)架构,总参数1T,激活参数32B。

据悉,Kimi K2具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,在 SWE Bench Verified、Tau2、AceBench 等多个权威基准测试中取得当前开源模型中的最佳成绩(),在数学推理与复杂任务理解方面也表现优异。


据介绍,该模型训练过程中采用 MuonClip 优化器,有效解决大参数量模型的稳定训练问题,提升 token 利用效率,在优质数据稀缺的背景下进一步拓展 Scaling 上限。

技术上,Kimi K2结合大规模 Agentic Tool Use 数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是构建通用 Agent 的关键基石,未来还将加入思考与多模态能力。

目前,Kimi K2模型已集成至 Kimi App 与官网平台,并提供 API 接入服务。API 兼容 OpenAI 与 Anthropic 的 Chat 接口,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

大V发博文质疑小米YU7耐力测试 再上热搜

网易汽车 浏览 942 06-27

黄仁勋闯进全球亿万富豪榜前10 与巴菲特只差10亿美元

界面新闻 浏览 766 07-12

拜登为何卸任前如此“恶毒”?

浏览 6247 07-14

空中客车5月交付51架飞机 较去年同期下降4%

财联社 浏览 5760 06-07

卡塔尔、科威特和巴林宣布重新开放领空

上观新闻 浏览 7491 06-24

中方回应冯德莱恩涉华言论:需要再平衡的是欧方心态

外交部网站 浏览 2195 07-10

库里晒参加塔霍湖高尔夫名人赛照片:让我们好好收尾吧

直播吧 浏览 3744 07-13

女人老了更要打扮,学会这样穿“裙子”,保准能收获一堆夸奖

静儿时尚达人 浏览 9639 06-13

女子买上海3000万元的豪宅 交房2年未办下不动产权证

每日经济新闻 浏览 586 06-19

拉美最大新能源车厂首车下线 助力比亚迪巴西销量

DearAuto 浏览 3177 07-06

加沙战场新动态:以军遭遇伏击致5死14伤

浏览 270 07-14

毒红曲中的"软毛青霉酸"是啥?

网易健康 浏览 5869 06-03

正在谈判却收到30%关税信函 欧洲议会高官怒斥特朗普

每日经济新闻 浏览 4610 07-13

谷歌安卓 Canary 版新特性再加一:引入全新 90:10 分屏布局

IT之家 浏览 6864 07-12

成都百亿低空独角兽,要去IPO了

投中网 浏览 2557 07-16

顶级豪华 极氪009光辉典藏版即将开启交付

车质网 浏览 6175 07-01

美联航一航班在北京起飞时着火 发动机或严重损坏

鲁中晨报 浏览 4238 05-28

重庆通报"游客吃烧烤3人花780元":商家有修改结算单

新民晚报 浏览 2190 06-09

特朗普宣布下月开征50%铜关税 美制造商忧成本飙升

浏览 5394 07-14

"昆仑石刻"是否为今人伪刻引争议 牧民称40年前曾见过

每日经济新闻 浏览 1392 07-11

中国证监会原发行监管部副主任李筱强被开除党籍:是政商“旋转门”腐败的典型

界面新闻 浏览 8969 07-13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11