关闭广告

Kimi深夜整活,开源了首个万亿参数模型

网易科技报道2025-07-13 00:00:015770人阅读

7月11日晚,月之暗面宣布正式发布新一代基础模型 K2,并同步开源。该模型采用稀疏激活(MoE)架构,总参数1T,激活参数32B。

据悉,Kimi K2具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,在 SWE Bench Verified、Tau2、AceBench 等多个权威基准测试中取得当前开源模型中的最佳成绩(),在数学推理与复杂任务理解方面也表现优异。


据介绍,该模型训练过程中采用 MuonClip 优化器,有效解决大参数量模型的稳定训练问题,提升 token 利用效率,在优质数据稀缺的背景下进一步拓展 Scaling 上限。

技术上,Kimi K2结合大规模 Agentic Tool Use 数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是构建通用 Agent 的关键基石,未来还将加入思考与多模态能力。

目前,Kimi K2模型已集成至 Kimi App 与官网平台,并提供 API 接入服务。API 兼容 OpenAI 与 Anthropic 的 Chat 接口,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

以军打死伊朗最高军事指挥官 伊朗:以方越过所有红线

极目新闻 浏览 9355 06-18

美国经济打鸡血!特朗普的大而美法案,如何影响中美竞争格局?

北向财经 浏览 10102 07-12

前NBA篮板+盖帽王!上海男篮邀怀特塞德试训 将打两场热身赛检验

醉卧浮生 浏览 206 09-09

年少成名的张一山似乎成为了下一个文章,一步错步步错,争议不断

新语爱八卦 浏览 1842 07-14

豆豆钱用担保费推高利率至36%,客诉含“校园贷”量为何这么高?

独角兽挖掘机 浏览 5699 07-12

官方回应"孕妇遭两男子殴打住院":一打人者系公职人员

扬子晚报 浏览 1022 07-16

旺仔小乔称张碧晨唯一原唱 汪苏泷方收授权?

韩小娱 浏览 8281 07-25

这些才是适合普通人的穿搭!衣服不买贵的重性价比,舒又得体

静儿时尚达人 浏览 248 08-24

佩林卡:希望东契奇专注于欧锦赛 之后把注意力转到湖人带队夺冠

直播吧 浏览 218 08-28

阿斯预测皇马揭幕战首发:巴尔韦德回归 迪亚斯、居勒尔先发

直播吧 浏览 271 08-19

特朗普对第23国加税踢到铁板了 巴西硬刚带头“反美”

掌青说历史 浏览 9697 07-12

南京大学东思嘉博士疑自杀去世 本人活泼漂亮履历优秀

180视角 浏览 304 08-27

债券承销惊现700元低价服务费!协会启动自律调查

21金融圈 浏览 1518 07-12

皮爷咖啡华南首店突然撤店背后:精品咖啡的处境越来越尴尬了

蓝鲸新闻 浏览 1901 08-12

特朗普宣布终止资助美国高铁:耗费数千亿美元无法交付

澎湃新闻 浏览 1762 07-17

6次夺回球权!田中碧当选英超首轮利兹联队内最佳球员

直播吧 浏览 275 08-20

断崖式降息,即将开启?

博闻财经 浏览 4280 07-13

嫦娥六号月壤研究成果,揭开月球背面月壳磁场弱与土壤磁性强之谜

IT之家 浏览 7289 07-14

7.5万美元买的Mirai氢燃料汽车成摆设,加州数百名车主起诉丰田

IT之家 浏览 2949 07-15

加密货币跌势连绵,近10亿美元杠杆仓被平,现货比特币ETF上周仅小幅净流入

华尔街见闻官方 浏览 21 12-02

3年1亿美元+末年球员选项!森林狼官宣续约兰德尔

直播吧 浏览 3502 07-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11