关闭广告

美团杀入开源大模型混战:LongCat登场,推理速度直破100 Token/s

AI寒武纪2025-09-01 00:00:01452人阅读


美团也推出一款名为 LongCat-Flash 的非推理开源(MIT)大模型,总参数量为 5600亿, MoE架构,激活 186亿至313亿参数(平均约270亿),模型性能看起来还是很不错的,尤其在智能体(Agentic)任务方面表现突出


一大看点是模型采用了 shortcut-connected 架构,扩展了计算与通信的重叠窗口,使推理能够在成本可控的情况下达到每秒100 Token 以上,我刚试了一下速度真的超快

体验地址:

https://longcat.ai

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小鹏加码主动安全:CEO 下场动员,想用技术成果回应外界质疑

晚点LatePost 浏览 537 09-01

潘长江靠短剧实现逆袭,截下特朗普的流量?

最爱酷影视 浏览 718 08-04

陈道明近照刷屏!已经70岁却被赞:这就是“帝王相”!

娱乐白名单 浏览 7059 07-23

彪马公布2025财年第二季度财报,中国市场鞋类业务增长12%

斑马消费 浏览 7215 07-26

全球第二,欣旺达,再冲固态电池!

飞鲸投研 浏览 345 10-19

特斯拉陶琳:认真对待电池回收,提取 90% 废料投入新电池生产

IT之家 浏览 586 08-11

小米成立新公司,要造电池?

电动知家 浏览 131 05-07

伊朗:不会与美谈判 美以不可能打了伊朗就一走了之

每日经济新闻 浏览 266 03-03

媒体:王毅三年来首次访问印度 北京加大力度缓解关系

上观新闻 浏览 626 08-17

阿里巴巴:斑马股份拟于香港联交所主板独立上市;泡泡玛特王宁:本周将发布迷你版LABUBU|早资道

封面新闻 浏览 473 08-21

长沙现"假装上班公司":20元买一个工位 自由安排时间

潇湘晨报 浏览 573 08-28

五旬老人带孩子,红雷叔和乃文叔都疯了。

伊周潮流 浏览 9452 08-09

朱琳0比2安德列娃 止步中网第二轮

体坛周报 浏览 297 09-29

上市公司30亿闲钱炒股,太豪了,释放了什么信号?

财联社 浏览 10511 08-09

新年资金入市!超450亿公募资金到位,“万亿活水”在路上

券商中国 浏览 327 01-12

美国被指对伊朗行动的准备在两周内完成

潇湘晨报 浏览 263 01-29

美防长下令从德国撤出5000名驻军

国际在线 浏览 131 05-02

美日敲定贸易协议,韩国压力大了……

国际金融报 浏览 7244 07-24

伊朗局势趋紧 美国从黎巴嫩撤人

澎湃新闻 浏览 241 02-24

泰国僧侣性丑闻爆发多名高级僧侣涉案 泰王罕见发声

澎湃新闻 浏览 5705 08-05

前皇马体能教练:若身体状况良好,魔笛本赛季至少能出战30场

懂球帝 浏览 5319 07-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11