关闭广告

深夜突发!Claude Opus 4.1发布:智能体、代码、推理能力全面提升

学术头条2025-08-06 12:00:024954人阅读

Anthropic 突然发布了 Claude Opus 4.1,这是对 Claude Opus 4 在 agentic 任务、真实世界编程和推理能力上的全面升级,并称计划在未来几周内发布对模型的大幅改进。

据介绍,Claude Opus 4.1 将编码性能提升至 SWE-bench Verified 测试中的 74.5%,同时还提升了深度研究和数据分析能力,尤其在细节追踪和 agentic 搜索方面。

Anthropic 还提到了第三方合作伙伴对 Claude Opus 4.1 的真实感受。

[哇]GitHub 指出,与 Opus 4 相比,Claude Opus 4.1 在大多数能力上均有提升,其中多文件代码重构的性能提升尤为显著。
[让我看看]Rakuten Group 发现,Opus 4.1 在大型代码库中精准定位具体修正点时表现优异,不会进行不必要的调整或引入 bug,他们更倾向于在日常调试任务中使用这种精准度。
[强]Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中较 Opus 4 提升了一个标准差,与从 Sonnet 3.7 到 Sonnet 4 的性能飞跃大致相当。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

【人物】迪马利亚,37岁的回家童话

体坛周报 浏览 482 08-25

“超节点+集群”:华为撞出来的算力之路

脑极体 浏览 464 09-21

巴黎夺金一周年!ESPN评詹姆斯:王冠之重何处可比?后者转发

直播吧 浏览 528 08-12

桂林16.5亿烂尾项目被通报 时任官员挪6500万强行上马

中国能源网 浏览 5365 07-15

神马电力回购计划引“10cm”涨停,实控人家族计划继续减持

时代周报 浏览 9563 07-31

怎么选择助眠保健品?

网易健康 浏览 9107 02-26

2025WAIC丨腾讯AI应用全景图亮相:1+3+N,加速打造“好用的AI”

雷峰网 浏览 5987 07-28

小米汽车卖到爆,争议却紧追着雷军跑

雷达财经 浏览 8638 08-14

1391场,44岁巴西门将法比奥成为足坛正式比赛出场最多的球员

懂球帝 浏览 509 08-20

泰国外长抵达联合国总部,通报泰柬冲突情况

界面新闻 浏览 7497 07-25

媒体:美以对伊朗战争持续不了太久 G7成员们也受不了

新民周刊 浏览 232 03-11

缅北白家犯罪集团首要分子白所成等21人被公诉

央视新闻客户端 浏览 3660 07-11

郭晶晶白天带孩子爬山,晚上在大学演讲

小娱乐悠悠 浏览 208 03-17

茅台失去的十年

锦缎研究院 浏览 208 12-15

记者:我认为杰克逊被严重低估了,去到拜仁后他还可以向凯恩学习

直播吧 浏览 459 09-02

美国枪击纵火案嫌犯是海军陆战队老兵 细节披露

看看新闻Knews 浏览 392 09-30

旧事重提!莱昂纳德舅舅及其团队曾向猛龙和湖人索要不正当利益

直播吧 浏览 448 09-11

西安咸阳机场疑有女孩坠楼砸到清洁工 多方回应

潇湘晨报 浏览 505 08-21

10月工信部新车合集:合资车企还在发力

爱驾天下 浏览 370 10-14

重点企业集聚、百亿母基金支持……湖北人形机器人产业初具规模

贝壳财经 浏览 1107 07-18

奥塔门迪:明年世界杯后我将退出国家队;感觉夺冠就像昨天

懂球帝 浏览 435 09-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11