关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:019381人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

《爸爸去哪儿》村长李锐,52岁签迪拜12亿大单

草莓解说体育 浏览 272 10-17

00后女孩为养家在工地干钢筋工:每天10小时赚320元

极目新闻 浏览 398 09-09

菲律宾发生6.9级地震 中国游客:雷暴雨特别大 还停电

红星新闻 浏览 375 10-01

37岁董晴能意外翻红,因为踩中了“隐形规则”

简读视觉 浏览 1212 07-17

天津外援阿代米谈胜利:现在要做的是忘掉这一场比赛,准备下一场

直播吧 浏览 397 09-22

福建舰弹射甲板焕然一新 8万吨巨舰做好最后服役准备

空天力量 浏览 1408 07-18

这样的“恶女”人设,真太爽了!

伊周潮流 浏览 205 11-15

还有反转?上周五“精准做空”引发全市场关注,神秘交易员再度开出1.6亿美元空单

华尔街见闻官方 浏览 301 10-13

63岁的吴镇宇刷老年卡坐公交被质疑?

今古深日报 浏览 240 11-05

大牛市!国家,下场买股票

米筐投资 浏览 3766 07-12

韩6旬福利院院长涉嫌性侵4名残障女性 受害者喊其爸爸

大风新闻 浏览 160 02-03

小米成都车祸引解锁争议 打不开的电动车门成监管焦点

界面新闻 浏览 304 10-14

地狱笑话的背后,是新女性生存样本

时尚COSMO 浏览 4771 07-17

监管重锤4200万!上海银行内控“黑洞”为何补不上

闺蜜财经 浏览 5193 08-11

抗癌不到一年,刘谦近况曝光,憔悴到认不出

乡野小珥 浏览 165 01-20

两年前曼城报7000万镑!英媒:西汉姆想卖帕奎塔&他的指控将被免

直播吧 浏览 6924 07-31

哈马斯:以色列将为占领加沙城付出沉重代价

每日经济新闻 浏览 4150 08-10

恭喜!波加查76小时0分32秒卫冕环法总冠军 第4次加冕创纪录

醉卧浮生 浏览 3278 07-28

百亿主动权益选手半年盘点:谁是崛起的黑马

智谷趋势 浏览 2993 07-18

美驱逐舰驶近伊朗海域 伊朗直升机驱逐遭警告

看看新闻Knews 浏览 7028 07-24

“豆腐靴”火了! 比马丁靴还好看, 早冬必穿!

Yuki女人故事 浏览 126 01-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11