关闭广告

深夜突发!Claude Opus 4.1发布:智能体、代码、推理能力全面提升

学术头条2025-08-06 12:00:024877人阅读

Anthropic 突然发布了 Claude Opus 4.1,这是对 Claude Opus 4 在 agentic 任务、真实世界编程和推理能力上的全面升级,并称计划在未来几周内发布对模型的大幅改进。

据介绍,Claude Opus 4.1 将编码性能提升至 SWE-bench Verified 测试中的 74.5%,同时还提升了深度研究和数据分析能力,尤其在细节追踪和 agentic 搜索方面。

Anthropic 还提到了第三方合作伙伴对 Claude Opus 4.1 的真实感受。

[哇]GitHub 指出,与 Opus 4 相比,Claude Opus 4.1 在大多数能力上均有提升,其中多文件代码重构的性能提升尤为显著。
[让我看看]Rakuten Group 发现,Opus 4.1 在大型代码库中精准定位具体修正点时表现优异,不会进行不必要的调整或引入 bug,他们更倾向于在日常调试任务中使用这种精准度。
[强]Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中较 Opus 4 提升了一个标准差,与从 Sonnet 3.7 到 Sonnet 4 的性能飞跃大致相当。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

挪威王储妃长子涉嫌性侵多人 其系母亲嫁入王室前所生

中国新闻周刊 浏览 345 09-08

塔雷:为米兰工作是我的梦想,这里的历史告诉我们胜利是最重要的

直播吧 浏览 491 08-24

河床青训主管:马斯坦托诺的视野能俯瞰全场,他有冲击金球的天赋

直播吧 浏览 4115 08-10

北京国安迎来成立33周年生日,海报中工体和球迷交相辉映

懂球帝 浏览 165 12-29

外媒:美国一大型风电场突然被美政府叫停 已完工80%

环球时报国际 浏览 2354 08-24

光从黑暗中产生:牛津物理学家重现极端量子真空效应

IT之家 浏览 2357 07-13

9.9元延误险被吐槽时间一分不差才能赔 航旅纵横回应

极目新闻 浏览 42833 08-28

如何养肾护肾?专家教你这样做!

人民网 浏览 5661 03-14

泽连斯基:俄对乌再次发动大规模空袭 

新华社 浏览 429 08-22

河床官方:阿根廷国脚后卫佩泽拉ACL断裂:据悉将伤缺7-8个月

懂球帝 浏览 473 08-11

阿斯:特巴斯被指控泄露巴萨财务信息,若查实可能被取消任职资格

直播吧 浏览 6602 08-14

暑期旅游市场大热,消费活力持续释放

商业观察杂志社 浏览 454 08-29

始祖鸟、蔡国强就烟花秀致歉

YOUNG财经 浏览 340 09-21

GPT-5第一波用户反馈:笨拙,还我4o

华尔街见闻官方 浏览 4630 08-09

万亿豪赌:OpenAI结盟芯片、云巨头,AI生态闭环了吗?

澎湃新闻 浏览 291 10-14

iPhone 17系列维修预估费用公布:标准版换屏2698元

鲁中晨报 浏览 435 09-13

哈哈哈!小米汽车,要杀进保时捷老家了

说财猫 浏览 364 08-21

北京移动用户吐槽早上没网络导致“没打上卡”!回应称正排查

南方都市报 浏览 3915 08-13

许凯出轨风波升级!女方自曝掌握更多恋爱和出轨证据,工作室发声

萌神木木 浏览 367 08-22

跨境网赌大佬佘智江将被引渡回中国 被指曾参与KK投资

红星新闻 浏览 234 11-12

以总理计划全面占领加沙 中方:敦促以方停止危险举动

看看新闻Knews 浏览 7124 08-07
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11