参考指南

8月6日消息，于本周一发布了其旗舰模型的升级版Claude Opus 4.1，该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分，超过了OpenAI的o3模型（69.1%）和谷歌的Gemini 2.5 Pro（67.2%），进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升，Opus 4.1还在研究和数据分析，特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构，在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时，Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3（ASL-3），要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示，Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为，例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响：企业热捧与开发者的审慎

尽管存在安全疑虑，企业客户的采纳热情并未减弱。GitHub方面表示，Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”；乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务，月费高达200美元，在几乎没有市场推广的情况下，仅用数周时间便实现了收入翻番，目前年度经常性收入已达到4亿美元。

开发者阮明日 (

GPT-5发布前夜，Anthropic抢先出牌，发布新模型Claude 4.1

行业「寒风」...

眼看选情不利...

天空体育：苏...

预售23.5...

生活越难，越...

春秋航班飞到...

嫁大15岁残疾富商被嘲拜金？黎姿如今的生活，打了多少人的脸

中国最大忽悠，再次震惊全球

曲协表态仅6天，郭德纲担心的事还是发生

九三阅兵重磅武器汇总来了

方程豹钛7现身形似“路虎卫士”轴距2米92

小米SU7又获第一，雷军发文！

预计月底！雷军太需要一场年度演讲了

王艺迪1-3不敌桥本帆乃香，无缘WTT瑞典站女单八强

女子1997年到银行存入2万定期 27年后利息不到5千元

李梓萌骗人真相大白，幕后黑手被揪

阅兵训练场上女民兵英姿飒爽

今年秋天一定要拥有的10件单品，时髦又高级！

预计今年秋季发布享界全新越野SUV谍照曝光

中国版山姆，全部关门了

《长安二十四计》成待播剧王，成毅1人单挑12权臣，谁不想看呢

布里斯班新科亚军科斯秋克：我的关于萨巴伦卡的话被断章取义

溢价24%仍失败！必和必拓被爆出价400亿英镑被拒，英美资源坚持自身并购计划

NASA 深空激光通信试验超额完成目标，为未来火星任务铺路

伊姐周六热推：电视剧《方圆八百米》；电视剧《金关》......

女孩被篮球砸头后确诊癔症自残失禁母亲:我也不理解

金龟子女儿大婚，老搭档董浩“绿泡泡”捧场祝贺，何炅因工作缺席

科学家构建三合一原位X射线平台，揭示CO₂电解中催化剂降解机制

Kimi团队发布K1.5：让AI像人类一样＂边思考边学习＂的突破性进展

可灵AI宣布多图参考生视频升级：模型效果提升102%