关闭广告

深夜突发!Claude Opus 4.1发布:智能体、代码、推理能力全面提升

学术头条2025-08-06 12:00:024698人阅读

Anthropic 突然发布了 Claude Opus 4.1,这是对 Claude Opus 4 在 agentic 任务、真实世界编程和推理能力上的全面升级,并称计划在未来几周内发布对模型的大幅改进。

据介绍,Claude Opus 4.1 将编码性能提升至 SWE-bench Verified 测试中的 74.5%,同时还提升了深度研究和数据分析能力,尤其在细节追踪和 agentic 搜索方面。

Anthropic 还提到了第三方合作伙伴对 Claude Opus 4.1 的真实感受。

[哇]GitHub 指出,与 Opus 4 相比,Claude Opus 4.1 在大多数能力上均有提升,其中多文件代码重构的性能提升尤为显著。
[让我看看]Rakuten Group 发现,Opus 4.1 在大型代码库中精准定位具体修正点时表现优异,不会进行不必要的调整或引入 bug,他们更倾向于在日常调试任务中使用这种精准度。
[强]Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中较 Opus 4 提升了一个标准差,与从 Sonnet 3.7 到 Sonnet 4 的性能飞跃大致相当。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

宋剑斌代履行杭州银行行长职责即将满半年,新行长人选或将出炉

湘财Plus 浏览 198 09-11

广安爱众0元收购一新能源发电公司90%股权

红星资本局 浏览 179 09-22

回归!官方:西汉姆与40岁门将法比安斯基签下至本赛季结束的合同

直播吧 浏览 178 09-11

Here we go!罗马诺:迈阿密中场克雷马斯基将租借加盟帕尔马

懂球帝 浏览 235 09-01

最高相差上千元!中转机票的羊毛能“薅”吗?

中新经纬 浏览 137 10-02

齐沃:意大利足球不以进球多著称;恩里克和迪乌夫终会迎来闪耀时刻

懂球帝 浏览 87 10-25

夏天衣服千万别买太多,认准T恤和连衣裙,舒适大方又高级

静儿时尚达人 浏览 7969 07-10

A股成交额再次突破3万亿元,天量背后钱从哪里来?

郭施亮 浏览 244 08-26

发现新疆戈壁"为人民服务"标语遭破坏 博主决定去修复

极目新闻 浏览 118 10-15

今日热点:《怪奇物语》番外动画剧预告;NEWBEAT签约摩登天空……

伊周潮流 浏览 48 11-08

碘是孕妇健康的守护神

北京青年报 浏览 3053 09-27

换上高尔夫GTI同款2.0T动力 新凌渡L GTS实车曝光

网易汽车 浏览 297 05-30

“富贵闲人”许绍雄的快乐哲学

仙女事件簿 浏览 67 10-29

听证会上一问三不知 特朗普提名"对抗中国"大使遭群嘲

上游新闻 浏览 3437 07-11

曾叫板姚明的巨人如今却瘫痪 记“大竹竿”布拉德利

仰卧撑FTUer 浏览 1014 08-12

赛后称德国女足不配取胜,法国女足国脚道歉:当时情绪上头了

懂球帝 浏览 1557 07-21

《数据周报83》:为何A股涨,人民币却不涨?

智本社 浏览 263 08-25

医生强奸2名未成年女孩被判6年 其检察官父亲任辩护人

澎湃新闻 浏览 8138 08-07

周年庆专场|| 我的洗漱台上,真的不能没有它

黎贝卡的异想世界 浏览 117 10-11

大模型与机器人互促共进的当下,他们想要共筑世界的“新终端”

文汇报 浏览 648 07-28

3年亏掉基民200亿,却收20多亿管理费!千亿基金公司,又一位副总要跑?

深蓝财经 浏览 4458 07-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11