关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:019220人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

50+女人别穿得“老气横秋”!掌握3个穿搭密码,减龄还显贵

静儿时尚达人 浏览 24 11-26

河南许昌3名小学生湖中捞鱼时溺水 2人救治无效死亡

环球网资讯 浏览 7560 06-18

竞得当日即奠基!深圳市、区国企携手共创城市空间升级“龙华速度”

中国商报 浏览 2724 08-10

输不起?曝蓉城球迷围殴+扔水瓶砸中河南队人员!或遭中足联处罚

我爱英超 浏览 288 08-20

香飘飘,败给奶茶店

新消费101 浏览 251 08-19

保健品顶流,要IPO了

投资家 浏览 4160 08-10

Neuralink宏伟蓝图:到2031年年收入达10亿美元

财联社 浏览 4097 07-24

视界大会后台社交名利场!欧豪起身主动接杨幂,剧组之间互相抱团

萌神木木 浏览 56 11-04

A股股民突破2.4亿,00后加快进场会改变他们的财富命运吗?

郭施亮 浏览 585 07-17

收割200亿,6800名投资者遭毒手,昔日千亿首富等待宣判

花朵财经 浏览 2287 07-26

法拍狸花猫撤拍后被爱猫人士领走 工作人员发声

大风新闻 浏览 304 08-23

A股,突破新高了!

小白读财经 浏览 303 08-13

茅台机场再推乘机抽飞天活动 中签率60%

每日经济新闻 浏览 262 08-20

媒体:特朗普宣布多份协议"带节奏" 欧盟反而转向强硬

新民晚报 浏览 5083 07-25

医疗暂停当盘外招?张本智和回应争议:王楚钦离场换衣服我也没说

我爱英超 浏览 342 08-12

特朗普再访英成"历史性时刻" 英国展现"罕见外交姿态"

环球网资讯 浏览 259 09-18

海航集团原美籍高管、首席执行官获刑6年 详情披露

经济观察报 浏览 4605 07-23

DeepSeek V3.1发布,成最好非思考编程模型

AI寒武纪 浏览 236 08-20

DeepMind刚拿完IMO金牌,科学家就被Meta挖走了,都是华人大牛

机器之心Pro 浏览 3259 07-23

景甜没想到,张继科已走上另一条上坡路

容景谈 浏览 5021 07-12

辛纳0-5落后退赛太意外,阿卡戏剧性夺冠后金大师伟业只差三站

网球之家 浏览 274 08-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11