关闭广告

深夜突发!Claude Opus 4.1发布:智能体、代码、推理能力全面提升

学术头条2025-08-06 12:00:024876人阅读

Anthropic 突然发布了 Claude Opus 4.1,这是对 Claude Opus 4 在 agentic 任务、真实世界编程和推理能力上的全面升级,并称计划在未来几周内发布对模型的大幅改进。

据介绍,Claude Opus 4.1 将编码性能提升至 SWE-bench Verified 测试中的 74.5%,同时还提升了深度研究和数据分析能力,尤其在细节追踪和 agentic 搜索方面。

Anthropic 还提到了第三方合作伙伴对 Claude Opus 4.1 的真实感受。

[哇]GitHub 指出,与 Opus 4 相比,Claude Opus 4.1 在大多数能力上均有提升,其中多文件代码重构的性能提升尤为显著。
[让我看看]Rakuten Group 发现,Opus 4.1 在大型代码库中精准定位具体修正点时表现优异,不会进行不必要的调整或引入 bug,他们更倾向于在日常调试任务中使用这种精准度。
[强]Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中较 Opus 4 提升了一个标准差,与从 Sonnet 3.7 到 Sonnet 4 的性能飞跃大致相当。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

少输当赢的利物浦,四大皆空哪还要等下回合?

仰卧撑FTUer 浏览 80 04-10

新质生产力“可感可及”,华强北机器人展演月“硬核度”爆表

南方都市报 浏览 335 09-29

智能体榜第一,纳米 AI 凭什么

极客公园 浏览 1305 07-24

成本极低!中国太阳能板在非洲"点亮"一个又一个国家

网易科技报道 浏览 450 08-22

国家统计局发布8月份分年龄组失业率数据

财联社 浏览 364 09-18

今日热点:许光汉否认和周子瑜恋情;郝熠然与诚实一口终止合作……

伊周潮流 浏览 43 04-18

企业悬赏百万征集公职人员违法线索 对方起诉索赔百万

极目新闻 浏览 476 08-20

卷首语 | 保卫复杂性:在被算法分裂的世界里留住清醒

时尚COSMO 浏览 3275 08-08

特朗普:俄乌问题“约两周后就能知道结果”

央视新闻客户端 浏览 525 08-22

谢霆锋带大儿子迪拜度假 儿子颜值被评没爸爸帅

阿废冷眼观察所 浏览 368 08-26

凤凰组合2-0程星/张驰,晋级韩国羽毛球公开赛混双4强

直播吧 浏览 225 09-26

世界羽联:将引入强制计时器规则,球员两分之间仅剩25秒准备时间

懂球帝 浏览 484 08-11

不去罗马了?葡媒:本菲卡和里奥斯郎情妾意,但未谈妥转会费

直播吧 浏览 4826 07-17

AI 六小龙,近半员工在脉脉看机会

字母榜 浏览 8251 07-26

伊朗称再次击落F-35战机 以军:不知情

每日经济新闻 浏览 7137 06-18

步行者无悬念留下卡莱尔 联盟第一主帅新季迎挑战

体坛周报 浏览 454 08-21

海关总署副署长教你鉴定真假Labubu:正版有九颗尖牙

上游新闻 浏览 892 07-15

为年轻用户打造Dream Car,零跑推出纯电掀背轿跑

Report汽车 浏览 211 11-09

经济上行期是什么样子的?

智谷趋势 浏览 1563 07-26

俄外长在朝鲜同金正恩"长时间密谈" 还回答11个问题 

新华社 浏览 4219 07-14

开撕了!亲爹是首富,嫡长公主租房住?

Yuki女人故事 浏览 331 09-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11