关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:019380人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:黄仁勋看到中美谈判路径 才敢跑来中国谈新生意

新民周刊 浏览 2929 07-16

实话实说:电车续航超1000km?有用,但不多!

少数派报告Report 浏览 136 02-21

云南外援奥斯卡连续七场联赛参与进球,刷新个人中超最长纪录

懂球帝 浏览 233 11-03

影像机能爆炸,这是朱一龙最惊艳的电影之一

幕味儿 浏览 265 11-05

扫街榜百日奇袭:高德正在成为AI时代的超级枢纽

光子星球 浏览 196 01-08

有公募基金喊出万点论,中国股市会从反弹演变成反转行情吗?

郭施亮 浏览 1003 07-28

助力AI全民创作 万兴科技(300624.SZ)旗下万兴天幕创作广场推出“视频教程共创激励计划”

智通财经 浏览 334 09-29

俄乌第三轮直接谈判结束 核心议题未突破

政知新媒体 浏览 9932 07-25

闫妮:除非她再拿视后

小椰的奶奶 浏览 284 10-17

京东领投,宁德时代旗下资本跟投!众擎机器人融资近10亿元

证券时报 浏览 9068 07-21

陈奕迅演唱会摔倒,网友争论:是意外还是安排?

韩小娱 浏览 1292 07-14

女子提离婚被捅近百刀身亡 丈夫因"抑郁发作"被判死缓

中国新闻周刊 浏览 412 09-20

"吉林一号"发布多张台湾岛高清卫星影像 屋顶细节可见

北京日报客户端 浏览 260 10-27

超300倍就清零!超高位科技股突然暴跌,中芯国际重挫7%

深蓝财经 浏览 298 10-11

专家:中美元首通话 两国关系可能要进入元首会晤阶段

澎湃新闻 浏览 411 09-21

“瓜子一哥”跌下神坛:净利暴跌七成,安徽前首富也救不了

金融八卦女 浏览 9663 07-31

午评:创业板指冲高回落涨0.55% 黄金概念股集体爆发

网易财经 浏览 393 09-01

8个月前碰撞损伤仍未修复 美"杜鲁门"号航母新照披露惹争议

环球网资讯 浏览 292 10-12

创女子体育新高,WTA与梅赛德斯-奔驰达成每年4700万美元合同

懂球帝 浏览 207 12-11

女子开奔驰逼停摩托车并下车猛踹其尾箱 警方再通报

界面新闻 浏览 505 08-22

美职联第26轮最佳阵:梅西领衔,阿尔巴入选,马斯切拉诺主帅

懂球帝 浏览 6957 07-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11