关闭广告

Kimi深夜整活,开源了首个万亿参数模型

网易科技报道2025-07-13 00:00:016031人阅读

7月11日晚,月之暗面宣布正式发布新一代基础模型 K2,并同步开源。该模型采用稀疏激活(MoE)架构,总参数1T,激活参数32B。

据悉,Kimi K2具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,在 SWE Bench Verified、Tau2、AceBench 等多个权威基准测试中取得当前开源模型中的最佳成绩(),在数学推理与复杂任务理解方面也表现优异。


据介绍,该模型训练过程中采用 MuonClip 优化器,有效解决大参数量模型的稳定训练问题,提升 token 利用效率,在优质数据稀缺的背景下进一步拓展 Scaling 上限。

技术上,Kimi K2结合大规模 Agentic Tool Use 数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是构建通用 Agent 的关键基石,未来还将加入思考与多模态能力。

目前,Kimi K2模型已集成至 Kimi App 与官网平台,并提供 API 接入服务。API 兼容 OpenAI 与 Anthropic 的 Chat 接口,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“50%汽车芯片由格力产品替代”?广汽回应

第一财经资讯 浏览 298 01-21

"晴格格"王艳丈夫被"限高" 本人就直播带货争议致歉

红星新闻 浏览 678 08-26

赵丽颖直播太实诚,被问儿子暖还是羊绒暖,赵丽颖果断选择儿子

扒虾侃娱 浏览 356 10-14

13.99万元起 深度解读深蓝L06三大黑科技

第五冲程 浏览 361 11-02

601689,实控人套现8.8亿

第一财经资讯 浏览 443 09-11

夺走宗家一半家产,娃哈哈的“隐形老板娘”,她到底凭什么?

北向财经 浏览 6781 07-21

CounterPoint称2025Q4印度手机市场联发科斩获48%份额

IT之家 浏览 222 03-17

陈涛:保级不能只寄希望于领袖球员;结果不好,我一人来承担

懂球帝 浏览 360 10-13

恒美光电收购三星SDI偏光片完成交割,将重塑全球竞争格局

澎湃新闻 浏览 541 09-02

张嘉倪带俩儿子迪士尼跨年,穿貂皮大衣好贵气

老吴教育课堂 浏览 241 01-02

WTA250布拉格站-诺斯科娃晋级四强 将战王欣瑜/贝杰莱克之间胜者

直播吧 浏览 858 07-25

聚焦AI+畜牧,刘松柏攻破鸡味密码,打造终身学习广东样本

南方都市报 浏览 220 03-03

从这个季度开始,市场不再质疑AI Capex了

钛媒体APP 浏览 456 08-19

华为里程碑!微信鸿蒙版安装量突破1500万:目标超越iOS

快科技 浏览 466 09-11

4岁男孩住酒店后确诊川崎病?12345回应

红星新闻 浏览 8062 10-29

年轻人,持续涌入股市!

券商中国 浏览 489 08-22

苏超休赛,他们很忙,有人去赣超“兼职”了!

国是直通车 浏览 42649 07-28

787“梦想客机”首次致命空难 波音再陷沼泽

上游新闻 浏览 7941 06-14

涉嫌在英首相住宅纵火男子被正式起诉

浏览 7855 07-14

Siri数据不给我用!马斯克怒告苹果OpenAI

网易科技报道 浏览 507 08-26

赵露思直播逻辑混乱,医生曾诊断患癔症,还多次破防引导网暴素人

萌神木木 浏览 3128 08-06
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11