关闭广告

深夜突发!Claude Opus 4.1发布:智能体、代码、推理能力全面提升

学术头条2025-08-06 12:00:024875人阅读

Anthropic 突然发布了 Claude Opus 4.1,这是对 Claude Opus 4 在 agentic 任务、真实世界编程和推理能力上的全面升级,并称计划在未来几周内发布对模型的大幅改进。

据介绍,Claude Opus 4.1 将编码性能提升至 SWE-bench Verified 测试中的 74.5%,同时还提升了深度研究和数据分析能力,尤其在细节追踪和 agentic 搜索方面。

Anthropic 还提到了第三方合作伙伴对 Claude Opus 4.1 的真实感受。

[哇]GitHub 指出,与 Opus 4 相比,Claude Opus 4.1 在大多数能力上均有提升,其中多文件代码重构的性能提升尤为显著。
[让我看看]Rakuten Group 发现,Opus 4.1 在大型代码库中精准定位具体修正点时表现优异,不会进行不必要的调整或引入 bug,他们更倾向于在日常调试任务中使用这种精准度。
[强]Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中较 Opus 4 提升了一个标准差,与从 Sonnet 3.7 到 Sonnet 4 的性能飞跃大致相当。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

会见莫迪,中方这三句话很意味深长

牛弹琴 浏览 380 09-01

美媒:美方仍在追截第三艘涉委内瑞拉油轮

上观新闻 浏览 177 12-23

张帅/汤森德2-0击败对手,晋级WTA1000蒙特利尔站双打次轮

直播吧 浏览 5130 07-31

传射建功,赫拉芬贝赫:上赛季只踢6号位,如今在场上有更多自由

直播吧 浏览 308 09-21

阿斯:有合适报价马竞会出售利诺,给阿尔马达非欧盟球员名额

直播吧 浏览 4389 07-21

铂爵旅拍被指"失联" 监管部门:该公司处于停业状态

每日经济新闻 浏览 5400 07-19

AI时代,寻找超级创业者!徐汇区发布政策扶持一个人赛过一群人的“大牛”

上观新闻 浏览 167 12-19

若昂-马里奥:尤文就像一个庞大的世界,大家都在帮助我融入

懂球帝 浏览 269 09-21

2名以色列国防军士兵在加沙南部身亡 调查结果公布

每日经济新闻 浏览 2843 07-28

央视主持人遭AI仿冒带货 官方通报

大象新闻 浏览 296 10-16

高阶华为+百万级底盘只卖21.99万?岚图FREE+真的太狠了

雷科技 浏览 6408 07-13

杨振宁回国定居在清华园已超20年 为自家取名"归根居"

南方都市报 浏览 240 10-19

一塌再塌!36岁檀健次与大二女生谈恋爱,他的高跟鞋就是锤

严肃八卦 浏览 181 01-08

光伏产业“反内卷”,国家出手了

中国新闻周刊 浏览 407 09-11

《玉茗茶骨》张慧雯啊,是最可惜的谋女郎

温柔娱公子 浏览 190 01-11

43岁阎鹤祥透露已婚:妻子怀孕4个月

极目新闻 浏览 6816 07-23

在巴林的中国旅客亲历空袭:你听!导弹又来了

澎湃新闻 浏览 140 03-03

苹果向下,小米向上

汽车公社 浏览 6377 07-11

王晶曝张国荣坠亡内幕,疑似内地大佬许诺落空,哥哥失望加重抑郁

不八卦会死星人 浏览 9194 07-10

特斯拉进入黑暗隧道

虎嗅APP 浏览 7477 07-25

内塔尼亚胡:加沙地带停火将很快进入下一阶段

环球网资讯 浏览 194 12-09
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11