关闭广告

深夜突发!Claude Opus 4.1发布:智能体、代码、推理能力全面提升

学术头条2025-08-06 12:00:024873人阅读

Anthropic 突然发布了 Claude Opus 4.1,这是对 Claude Opus 4 在 agentic 任务、真实世界编程和推理能力上的全面升级,并称计划在未来几周内发布对模型的大幅改进。

据介绍,Claude Opus 4.1 将编码性能提升至 SWE-bench Verified 测试中的 74.5%,同时还提升了深度研究和数据分析能力,尤其在细节追踪和 agentic 搜索方面。

Anthropic 还提到了第三方合作伙伴对 Claude Opus 4.1 的真实感受。

[哇]GitHub 指出,与 Opus 4 相比,Claude Opus 4.1 在大多数能力上均有提升,其中多文件代码重构的性能提升尤为显著。
[让我看看]Rakuten Group 发现,Opus 4.1 在大型代码库中精准定位具体修正点时表现优异,不会进行不必要的调整或引入 bug,他们更倾向于在日常调试任务中使用这种精准度。
[强]Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中较 Opus 4 提升了一个标准差,与从 Sonnet 3.7 到 Sonnet 4 的性能飞跃大致相当。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

计划于6月8日首航 川航再添一架熊猫涂装A350飞机

封面新闻 浏览 4020 06-06

全新奔驰GLC EV内饰官图来了,奔驰中最大屏幕,未来会国产!

汽车公告板 浏览 402 09-06

大学生网购10套古装表演后集体退货 商家:裤裙都脏了

极目新闻 浏览 10493 06-11

基于通义万相开发,美图多款APP上线动漫特效、变身等视频生成功能

财闻 浏览 348 09-11

彻底闹掰!阿斯:巴萨将审查特狮能否拒绝签字&球队是否能处罚他

直播吧 浏览 4732 08-07

小吧译言家 超两亿重塑锋线,红魔新三叉戟真能碰撞出激情火花吗

直播吧 浏览 2453 08-10

村主任被通报:耗资4600余万办企业 2家巨亏1家倒闭

鲁中晨报 浏览 8080 06-25

萝卜快跑计划将业务扩展至澳洲和东南亚

盖世汽车 浏览 329 09-29

山东舰“近万架次”舰载机起降透露什么信号

环球网资讯 浏览 9018 07-18

大S墓碑曝光!环境布置很简陋,具俊晔太痴情

黄小仙的搞笑视频 浏览 10441 07-30

关税风暴下,鲁比奥的亚洲之行能否破局?

国际金融报 浏览 1807 07-13

港媒曝向佐欠赌债140万,遭何超琼公司起诉

可乐谈情感 浏览 4563 07-16

青岛无杨瀚森后光速确定四外援:续约米奇韦瑟斯庞 引进杨+汤普森

醉卧浮生 浏览 3380 07-25

“打不开的车门”为何成致命陷阱?

国际金融报 浏览 250 10-20

中国家庭,还缺一辆旅行车

虎嗅APP 浏览 456 08-23

以军禁止约旦人道主义援助物资进入加沙

北青网-北京青年报 浏览 350 09-19

新车看点 | 标配华为乾崑智驾ADS 4,岚图FREE+不到22万元起售

观察者网 浏览 4964 07-13

20名以色列被扣押人员将分两批获释

CCTV国际时讯 浏览 291 10-14

8个字引爆国产芯片!UE8M0 FP8到底是个啥?

华尔街见闻官方 浏览 334 08-25

工信部第405批申报图曝光:比亚迪、华为系全面出击

网易汽车 浏览 107 03-17

男子除夕夜杀害7个月大侄女 弟弟在庭上与其对视痛哭

红星新闻 浏览 2325 08-07
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11