关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:019221人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

老板开学前接到中学300盒燕窝"大订单" 差点损失14万

环球网资讯 浏览 311 08-26

英超积分榜:热刺伯恩茅斯分列二、三 狼队全败 维拉西汉姆5轮3分

直播吧 浏览 147 09-22

穿真丝的,都是时髦女人!

Yuki女人故事 浏览 9933 06-06

涵盖就医、上学、社保等 重磅民生文件公布

界面新闻 浏览 4135 06-10

交手6次输了5次!林诗栋连追3局后葬送机会 张本智和4-3晋级决赛

风过乡 浏览 2340 07-13

2年1亿美元!杜兰特有望与火箭达成续约:比顶薪标准少拿2210万

罗说NBA 浏览 306 08-11

记者:巴萨即将与德容完成续约,弗里克上赛季成功激活了他

直播吧 浏览 694 07-29

洛杉矶高层:签下孙兴慜是一次冒险,他展现出梅西般的影响力

懂球帝 浏览 75 10-31

在意甲最草根的球会 创造新的"莱斯特奇迹"

西北望看台 浏览 146 09-22

北京大学教授俞孔坚在巴西坠机遇难

澎湃新闻 浏览 170 09-25

印度向巴基斯坦多地发射导弹 巴方称击落印度2架战机

上观新闻 浏览 6408 05-07

日常“大地震”的时尚圈,本季米兰周又洗什么牌?

时尚COSMO 浏览 136 10-01

国联民生:做产业最友好的投行

券商中国 浏览 223 08-22

美无人机出现在委内瑞拉近海

北青网-北京青年报 浏览 7 12-11

WTT横滨冠军赛赛程来了!5天战斗决出两项冠军,赛事总奖金360万

乒谈 浏览 1382 08-06

满足特朗普要求 北约峰会通过5%军费目标

环球网资讯 浏览 4587 06-26

94岁杨少华去世,上午剪彩眼神涣散数小时后离世,家人做法惹争议

不八卦会死星人 浏览 6208 07-13

全新一代速腾L三季度上市,预计新老同堂销售,像不像小迈腾?

车轮生活 浏览 7188 07-07

乔布斯之女与英国马术奥运冠军举办婚礼 哈里斯出席

红星新闻 浏览 8896 07-28

卢卡申科:我也谴责过普京 我相信他对很多事感到后悔

澎湃新闻 浏览 5666 08-10

河南女医生遭"网暴"坠亡 丈夫:她遗书里让我为她正名

极目新闻 浏览 4341 08-06
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11