关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:019379人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

口腔内的“神秘斑纹”是什么?

网易健康 浏览 4423 04-18

俄外长:英国100%参与了乌克兰对俄的“恐怖袭击”

澎湃新闻 浏览 1932 06-11

这些才是普通人都该学的冬季穿搭!不浮夸、不单薄,自然保暖

静儿时尚达人 浏览 202 12-10

哈马斯证实达成加沙停火协议 呼吁特朗普确保以执行

界面新闻 浏览 348 10-09

正逢七周年关键转型期,瑞华健康总经理主动请辞

达摩财经 浏览 4848 07-18

男子除夕夜杀害7个月大侄女 弟弟在庭上与其对视痛哭

红星新闻 浏览 2325 08-07

星光大赏残酷名利场:张国立赵露思坐第一排C位,座位图等级分明

娱乐圈笔娱君 浏览 163 12-23

锡安复出生涯首次替补18+6 鹈鹕送公牛9战第8败吉迪11+7+5

醉卧浮生 浏览 180 12-15

人口仅53万!佛得角力压喀麦隆再赢一场直通世界杯,FIFA排名73

直播吧 浏览 355 09-11

峨眉山,为何被游客“抛弃”?

智谷趋势 浏览 322 09-21

中国联通原副总经理获刑12年 曾搞权色、钱色交易

政知新媒体 浏览 250 10-29

出门问问曾森:做AI硬件,我们最大的优势是踩过很多坑

时代周报 浏览 9136 07-30

销售渠道改为“单城单店”模式?丰田中国:仅少数地区试点|早报

汽车服务世界 浏览 232 10-24

法国或承认巴勒斯坦国 美大使:你们可以“割地”

看看新闻Knews 浏览 10165 06-04

继百万私人厨师曝光后,林青霞又被爆另一癖好

卷史 浏览 5157 07-12

特朗普证实美方人员正撤离中东:中东已成为危险区域

每日经济新闻 浏览 1824 06-13

“叫不醒”的董璇,比谁都清醒

娱乐圈笔娱君 浏览 7768 08-14

破云! 中国无人机三闯生死线

看看新闻Knews 浏览 7547 07-12

湖人123-120险胜猛龙,八村垒三分绝杀,詹姆斯17中4仅8分

懂球帝 浏览 189 12-05

俄发生全球14年来最大地震美发布海啸预警 特朗普发声

红星新闻 浏览 2115 07-31

今年13.5万名考生报考军校 部分录取分数逼近顶尖985

大象新闻 浏览 6388 08-03
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11