关闭广告

深夜突发!Claude Opus 4.1发布:智能体、代码、推理能力全面提升

学术头条2025-08-06 12:00:024951人阅读

Anthropic 突然发布了 Claude Opus 4.1,这是对 Claude Opus 4 在 agentic 任务、真实世界编程和推理能力上的全面升级,并称计划在未来几周内发布对模型的大幅改进。

据介绍,Claude Opus 4.1 将编码性能提升至 SWE-bench Verified 测试中的 74.5%,同时还提升了深度研究和数据分析能力,尤其在细节追踪和 agentic 搜索方面。

Anthropic 还提到了第三方合作伙伴对 Claude Opus 4.1 的真实感受。

[哇]GitHub 指出,与 Opus 4 相比,Claude Opus 4.1 在大多数能力上均有提升,其中多文件代码重构的性能提升尤为显著。
[让我看看]Rakuten Group 发现,Opus 4.1 在大型代码库中精准定位具体修正点时表现优异,不会进行不必要的调整或引入 bug,他们更倾向于在日常调试任务中使用这种精准度。
[强]Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中较 Opus 4 提升了一个标准差,与从 Sonnet 3.7 到 Sonnet 4 的性能飞跃大致相当。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

半导体封测第一股,进击汽车电子!

飞鲸投研 浏览 279 01-20

九江银行2484万股权遭拍卖!每股15元谁会接盘?

独角金融 浏览 9024 07-29

影石Insta360两款新品无人机首曝,外观似穿越机、航拍无人机

IT之家 浏览 8512 07-21

防御"利刃"出鞘:反无人机强大"铁三角"

上观新闻 浏览 365 09-08

美国进逼委内瑞拉 分析人士:已突破国际法的危险界限

上观新闻 浏览 391 10-31

穆迪:卢尼带我入门瑜伽这项运动 我们经常一起练习

直播吧 浏览 4227 07-26

选秀专家:夏联时开拓者副总向我炫耀小杨“我们选的家伙咋样?”

直播吧 浏览 3273 08-10

微信又有新功能!网友:我存存存存……

中国基金报 浏览 3211 07-13

即时零售收入同比增12% 阿里猛攻本地生活

北京商报 浏览 431 09-01

阅兵准备基本就绪 已经进入倒计时

新华社 浏览 405 08-29

多名革命卫队指挥官、核科学家身亡,哈梅内伊高级顾问重伤

澎湃新闻 浏览 1231 06-14

昔日龙头“欠薪跑路”,百亿旅拍市场凉了?

电商在线 浏览 9226 07-24

从实验室到生产线南阳理工学院15年磨一剑赋能汽车制造升级

大象新闻 浏览 176 04-10

仅自己可见:腾讯QQ群聊消息官宣支持元宝AI总结功能

IT之家 浏览 296 12-11

多款长征火箭首次现身国外航展

澎湃新闻 浏览 9042 06-18

刚性需求凸显,新型储能产业发展按下快进键!多家企业加码布局

览富财经网 浏览 216 03-11

章子怡带醒醒追星宋雨琦,母女俩飞日本看演唱会,后台合影超开心

扒虾侃娱 浏览 376 10-20

《花少7》女明星集体卸妆,被李沁给美到了

娱乐圈笔娱君 浏览 484 08-23

AWS 展示分布式集群 Rainier,有望成为最强 AI 模型训练计算机

IT之家 浏览 9140 07-14

博主:塞鸟与伊万同属经纪人李锋,归化的初衷显然不是国家队

懂球帝 浏览 8082 07-27

中国大使会见哈马斯最高领导人,这步棋真妙

浏览 8773 07-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11