关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:019461人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

北京独生女被男友殴打致残:他让我再买房写他儿子名字

黄河新闻网吕梁频道 浏览 300 01-08

香港知名女星疑和小7岁外籍男友低调结婚

可乐谈情感 浏览 8476 07-27

伊朗官员:如达成谅解 霍尔木兹海峡将恢复通行

国际在线 浏览 13 06-14

海军舰载航空兵某部开展飞行训练

金台资讯 浏览 476 08-12

资产上亿女老板突然失联 知情人:疑似被骗去泰国

上观新闻 浏览 577 09-22

饭都不香了,奥尔特曼焦虑:美国低估了中国…

观察者网 浏览 520 08-20

今年最流行的5双鞋,配阔腿裤太好看了!

LinkFashion 浏览 847 06-16

后场槽点还是多!就赵睿靠谱,胡明轩做牺牲,其余各将都存隐患!

篮球资讯达人 浏览 6418 07-25

航班突然提前15小时起飞 乘客傻眼:第一次遇到

封面新闻 浏览 369 09-28

刚刚,OpenAI星际之门要建5GW数据中心,马斯克祭出AI基建5年计划

机器之心Pro 浏览 1718 07-23

德雷珀:因手臂伤势将缺席2025年余下的比赛

懂球帝 浏览 436 09-09

云业务继续狂飙!甲骨文与Meta洽谈200亿美元AI云计算协议

华尔街见闻官方 浏览 422 09-20

伊朗多名将领、核科学家遇袭身亡 身份披露

澎湃新闻 浏览 10573 06-14

铲车司机在北京洪水中勇救百余人:说我是英雄过誉了

极目新闻 浏览 3001 07-30

3件开心小事|| 这条视频竟然有一千万人看了

黎贝卡的异想世界 浏览 293 12-24

熊节:落实务实合作,全球南方亟需搭建多边平台|讲堂176-6⑤

文汇报 浏览 488 08-25

内蒙古"婚内强奸案"男方疑妻出轨 强行发生关系拍视频

中国新闻周刊 浏览 7826 08-13

郑丽文上任3天《人民日报》发文促统 郑丽文判断没错

时时有聊 浏览 340 11-05

被家暴16次女子得70%共同财产及10万赔偿 共140万余元

极目新闻 浏览 369 10-25

疑因店员手指浸入面汤起争执 其子持刀冲向顾客被拦下

大风新闻 浏览 644 08-12

郑州银行又向地产商追债11亿,去年卖掉百亿债权、房产业不良率增至9.55%

湘财Plus 浏览 2140 07-24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11