关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:019382人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

俄知名富商前CEO失踪4天 手机信号消失在沿海悬崖

红星新闻 浏览 211 01-13

小米磁吸支架充电宝 10000 7.5W 开售:自带线设计,169 元

IT之家 浏览 3905 08-10

专家:美军突袭委内瑞拉战术有新变化 有4个突出特点

北京日报客户端-长安街知事 浏览 196 01-05

9年4亿旧账未了,东证资管二审上诉!建元信托如何接招?

独角金融 浏览 463 08-26

牛弹琴:特朗普发出最后通牒 普京根本不信正在憋大招

上游新闻 浏览 3980 07-16

出道25年花期只能演小配角 他的实力被低估了

春序娱乐 浏览 415 08-25

主理人餐厅越开越多,年轻人却不买账了

餐饮老板内参 浏览 7215 08-13

官方:安德尔-伊恩比祖亚担任中乙广东铭途主教练

懂球帝 浏览 200 01-15

理想i8出师不利:发布后投资者不买账 理想汽车美股下跌6%

雷递 浏览 5021 07-30

迈阿密国际官方发海报纪念梅西加盟两年:正在创造的历史

直播吧 浏览 2694 07-16

夏天衣服别总穿“黑色”!这些穿搭减龄显活力,很适合普通人

静儿时尚达人 浏览 346 09-02

区城管局副局长被指长期性侵继女 当地通报:已被批捕

扬子晚报 浏览 331 09-30

新能源车双税新政发布,郑州消费者该“下手”还是“等等”?

大象新闻 浏览 289 10-13

今年夏天一定要拥有这10件衣服,太时髦了!

LinkFashion 浏览 5183 06-22

每天坚持熬夜,多久会亖?

身体密码破译局 浏览 3874 05-31

美军机沿伊朗边界飞行 伊朗寻求外交支持

新华社 浏览 202 01-15

陪伴机器人彻底凉了?曾是CES爆款,如今却已销声匿迹

雷科技 浏览 2807 07-16

特朗普称要夺回"靠近中国核武器设施"的基地 中方回应

环球网资讯 浏览 416 09-20

中国男篮赢球背后4大难题:12助攻22失误 赵睿迷失缺防守尖兵

醉卧浮生 浏览 2932 07-16

鲁杰里:西蒙尼和加帅有共通之处;我们有效限制了国米的发挥

懂球帝 浏览 227 11-27

一加 15 / Ace6“双舰齐发”,新机发布定档 10 月 17 日

IT之家 浏览 283 10-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11