关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:019460人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

上年纪的女人穿衣别焦虑,试试这几个搭配套路,优雅还减龄

静儿时尚达人 浏览 352 10-24

老人去世留下8套房给非亲生女儿分最多 3个儿子不认可

极目新闻 浏览 372 09-26

男子收1300万元拆迁款后被控敲诈勒索获刑 终审无罪

极目新闻 浏览 365 10-13

米体:国米训练场外有人卖卢克曼印字的盗版球衣

直播吧 浏览 523 08-22

阔腿裤失宠了,今年的“显瘦小黑裤”更时髦百搭!

LinkFashion 浏览 246 01-14

内塔尼亚胡证实以色列打死伊朗情报部门负责人

央视新闻客户端 浏览 5497 06-17

强强联手!市北高新、临汾路街道与中科信息签署战略合作协议,共促人工智能与超高清视听创新发展

上观新闻 浏览 280 12-16

买包的尽头是帆布包?她花几十块拿下女明星同款

黎贝卡的异想世界 浏览 5101 07-12

媒体:与多国领导人关系微妙之际 特朗普或下月访韩

上观新闻 浏览 555 09-08

黄仁勋身家超过巴菲特

21世纪经济报道 浏览 8024 07-14

澳波:我完全不知道为何大家总以负面眼光看我,我挺招人喜欢

懂球帝 浏览 427 09-20

九年情怀喂了狗!《楚乔传2》口碑崩盘

肆季娱乐 浏览 179 04-10

17年前的今天,纳达尔首登世界第一!

网球之家 浏览 707 08-19

薅了5.2万,大肥肉

越女事务所 浏览 2412 07-17

我国电动船舶锂电池安全防控技术实现新突破

新华社 浏览 274 01-02

诠释化繁为简全新设计理念 奥迪Concept C亮相

网易汽车 浏览 485 09-08

衣服完全没有必要越买越多!准备好这3款单品,百搭又舒适

静儿时尚达人 浏览 275 01-07

以总理:以不受美伊协议涉黎巴嫩条款约束

界面新闻 浏览 11 06-16

台军演为"阻挡"解放军登陆公路设路障 两侧草坪不设防

空天力量 浏览 2545 07-18

英伟达市值一度破4万亿美元 人工智能成风口

浏览 4099 07-14

官方:成都蓉城前外援、韩国前国脚金敃友加盟K2水原三星队

懂球帝 浏览 3144 07-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11