关闭广告

深夜突发!Claude Opus 4.1发布:智能体、代码、推理能力全面提升

学术头条2025-08-06 12:00:024950人阅读

Anthropic 突然发布了 Claude Opus 4.1,这是对 Claude Opus 4 在 agentic 任务、真实世界编程和推理能力上的全面升级,并称计划在未来几周内发布对模型的大幅改进。

据介绍,Claude Opus 4.1 将编码性能提升至 SWE-bench Verified 测试中的 74.5%,同时还提升了深度研究和数据分析能力,尤其在细节追踪和 agentic 搜索方面。

Anthropic 还提到了第三方合作伙伴对 Claude Opus 4.1 的真实感受。

[哇]GitHub 指出,与 Opus 4 相比,Claude Opus 4.1 在大多数能力上均有提升,其中多文件代码重构的性能提升尤为显著。
[让我看看]Rakuten Group 发现,Opus 4.1 在大型代码库中精准定位具体修正点时表现优异,不会进行不必要的调整或引入 bug,他们更倾向于在日常调试任务中使用这种精准度。
[强]Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中较 Opus 4 提升了一个标准差,与从 Sonnet 3.7 到 Sonnet 4 的性能飞跃大致相当。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

经纪人回应“陈冠希飞机上怒怼空乘”

扬子晚报 浏览 5436 06-19

闫学晶风波终于落幕,6个男人惨遭牵连

青橘罐头 浏览 275 01-27

“家居首富”离奇去世,“蛇吞象交易”惹的祸?

阿尔法工场 浏览 5632 07-29

扎十一惹:像鸟飞往她的山

时尚COSMO 浏览 220 03-14

对话中关村科金喻友平:大模型ToB市场远远没被开拓出来

网易科技报道 浏览 515 08-22

“罗小黑”热度不减 中文在线尚未跑通IP

北京商报 浏览 309 11-27

专属闪电红车漆 吉利熊猫卡丁猪猪侠限定版8月上市

网易汽车 浏览 43506 07-30

多名男女当街爬行学狗叫 官方:企业团建行为已致歉

极目新闻 浏览 393 10-18

猥亵继女的上海民警获刑8年 曾威胁继女报警就杀了她

潇湘晨报 浏览 681 08-12

43亿美元!LG新能源签下LFP电池供应大单,背后客户据称是特斯拉

财联社 浏览 10415 07-31

美国将打造全球首座可移动核反应堆工厂,落户“曼哈顿计划”旧址

IT之家 浏览 394 10-15

美扬言禁止中国人购买农田 媒体:披露的数字让人发笑

环球时报 浏览 10205 07-10

行驶超7万公里,初代问界M5满足国标涉水、底部撞击、火烧要求

IT之家 浏览 291 12-02

赫夫在西班牙球局大杀四方!哈利伯顿点评新队友:我嘞个豆

直播吧 浏览 7053 07-27

又一个受到官方认可的演员出现!迪丽热巴把新疆舞跳到了国外!

烟云过眼 浏览 911 07-24

周末两大利空!科技股被一致看空,国常会、证监会重磅

看财经show 浏览 343 11-03

便宜几千块!三星家电撤出中国后,闲鱼上的「骨折价」值得买吗?

雷科技 浏览 121 05-09

学术界的阶层固化,比我们想象的更严重

知识分子 浏览 500 08-26

剧版《西虹市首富》首波口碑出炉了!观众打分评价都“一针见血”

娱乐圈笔娱君 浏览 260 02-03

经典落幕:苹果正式将初代iPhone SE列为过时产品

环球网资讯 浏览 273 12-02

宁波诺丁汉大学"44万学费的录取通知书"火了

极目新闻 浏览 27848 08-08
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11