关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:019465人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

九三阅兵重磅武器汇总来了

红星新闻 浏览 424 09-04

方程豹钛7现身 形似“路虎卫士”轴距2米92

闻车品百魅 浏览 2736 07-25

小米SU7又获第一,雷军发文!

电动知家 浏览 603 05-30

预计月底!雷军太需要一场年度演讲了

三言科技 浏览 490 09-11

王艺迪1-3不敌桥本帆乃香,无缘WTT瑞典站女单八强

懂球帝 浏览 439 08-22

女子1997年到银行存入2万定期 27年后利息不到5千元

极目新闻 浏览 793 08-10

李梓萌骗人真相大白,幕后黑手被揪

近史博览 浏览 359 10-20

阅兵训练场上女民兵英姿飒爽

人民网-人民日报 浏览 388 08-23

今年秋天一定要拥有的10件单品,时髦又高级!

LinkFashion 浏览 276 10-07

预计今年秋季发布 享界全新越野SUV谍照曝光

车质网 浏览 124 05-07

中国版山姆,全部关门了

财通社 浏览 10475 08-07

《长安二十四计》成待播剧王,成毅1人单挑12权臣,谁不想看呢

最爱酷影视 浏览 8754 07-10

布里斯班新科亚军科斯秋克:我的关于萨巴伦卡的话被断章取义

网球之家 浏览 285 01-12

溢价24%仍失败!必和必拓被爆出价400亿英镑被拒,英美资源坚持自身并购计划

华尔街见闻官方 浏览 262 12-02

NASA 深空激光通信试验超额完成目标,为未来火星任务铺路

IT之家 浏览 394 09-20

伊姐周六热推:电视剧《方圆八百米》;电视剧《金关》......

伊周潮流 浏览 147 04-26

女孩被篮球砸头后确诊癔症自残失禁 母亲:我也不理解

上游新闻 浏览 389 10-26

金龟子女儿大婚,老搭档董浩“绿泡泡”捧场祝贺,何炅因工作缺席

不八卦会死星人 浏览 1277 07-31

科学家构建三合一原位X射线平台,揭示CO₂电解中催化剂降解机制

DeepTech深科技 浏览 383 10-27

Kimi团队发布K1.5:让AI像人类一样"边思考边学习"的突破性进展

科技行者 浏览 414 09-21

可灵AI宣布多图参考生视频升级:模型效果提升102%

网易科技报道 浏览 4287 07-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11