参考指南

8月6日消息，于本周一发布了其旗舰模型的升级版Claude Opus 4.1，该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分，超过了OpenAI的o3模型（69.1%）和谷歌的Gemini 2.5 Pro（67.2%），进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升，Opus 4.1还在研究和数据分析，特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构，在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时，Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3（ASL-3），要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示，Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为，例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响：企业热捧与开发者的审慎

尽管存在安全疑虑，企业客户的采纳热情并未减弱。GitHub方面表示，Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”；乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务，月费高达200美元，在几乎没有市场推广的情况下，仅用数周时间便实现了收入翻番，目前年度经常性收入已达到4亿美元。

开发者阮明日 (

GPT-5发布前夜，Anthropic抢先出牌，发布新模型Claude 4.1

我国又添“超...

多项操作亮眼...

Sora 2...

纽约华人女子...

美无人机出现...

小红书文玩女...

巴勒斯坦多派别谴责以方持续违反停火协议

划重点！金融支持新型工业化，七部门重磅发文！

为明年的 iPhone 设计的“A20”芯片价格可能会大幅上涨

《爸爸去哪儿》村长李锐，52岁签迪拜12亿大单

00后女孩为养家在工地干钢筋工：每天10小时赚320元

菲律宾发生6.9级地震中国游客：雷暴雨特别大还停电

37岁董晴能意外翻红，因为踩中了“隐形规则”

天津外援阿代米谈胜利：现在要做的是忘掉这一场比赛，准备下一场

福建舰弹射甲板焕然一新 8万吨巨舰做好最后服役准备

这样的“恶女”人设，真太爽了！

还有反转？上周五“精准做空”引发全市场关注，神秘交易员再度开出1.6亿美元空单

63岁的吴镇宇刷老年卡坐公交被质疑？

大牛市！国家，下场买股票

韩6旬福利院院长涉嫌性侵4名残障女性受害者喊其爸爸

小米成都车祸引解锁争议打不开的电动车门成监管焦点

地狱笑话的背后，是新女性生存样本

监管重锤4200万！上海银行内控“黑洞”为何补不上

抗癌不到一年，刘谦近况曝光，憔悴到认不出

两年前曼城报7000万镑！英媒：西汉姆想卖帕奎塔&他的指控将被免

哈马斯：以色列将为占领加沙城付出沉重代价

恭喜！波加查76小时0分32秒卫冕环法总冠军第4次加冕创纪录

百亿主动权益选手半年盘点：谁是崛起的黑马

美驱逐舰驶近伊朗海域伊朗直升机驱逐遭警告

“豆腐靴”火了! 比马丁靴还好看, 早冬必穿!