关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:019464人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

TA:维阿在接受马赛体检,100万欧租借费+1400万欧强制买断

直播吧 浏览 1379 08-07

小伙花2万多"签约寻爱"却"竹篮打水":见个面就叫约会

大风新闻 浏览 463 09-03

特朗普在AI峰会上再表态:我们与中国"相处得很好"

环球网资讯 浏览 2545 07-25

英伟达帝国“储君”:黄仁勋的一儿一女

华尔街见闻官方 浏览 7953 08-10

哪种情况需要做痔疮手术?

网易健康 浏览 8444 02-26

女子产后55天被丈夫殴打:只是要求他搬走空气净化器

封面新闻 浏览 21 06-17

吃盐太多真的会变丑?

网易健康 浏览 3320 02-26

宗庆后私生女宗婕莉的庆生照流出 打扮漂亮很像妈妈

古希腊掌管松饼的神 浏览 1738 07-15

丹麦国防部:若美国武力夺岛 丹麦士兵可先开枪再请示

环球网资讯 浏览 304 01-09

2025抖音创作者大会上,面向创作者发布四大计划

光子星球 浏览 427 09-21

全球5个让你屏住呼吸的震撼装置艺术

时尚COSMO 浏览 1352 07-09

青甘大环线有老外开敞篷老爷车行驶 有1955款劳斯莱斯

极目新闻 浏览 436 10-09

美航空业警告:美关税政策破坏供应链 或危及航空安全

海外网 浏览 3930 06-05

云南抗癌女孩离世年仅13岁:半岁时生父心梗猝死

红星新闻 浏览 8047 06-26

罗斯柴尔德家族现遗产之争:93岁婆婆与60岁儿媳打官司

红星新闻 浏览 287 12-16

6旬董事长直播间跳舞20万人围观 女儿接班7年巨亏32亿

极目新闻 浏览 512 09-10

《VOGUE》杂志内涵明星!势利眼、抢压轴,热巴杨幂隔空躺枪

萌神木木 浏览 352 10-21

中方驳回稀土进口申请 美防务公司:每天都胆战心惊

澎湃新闻 浏览 4369 08-05

海狮06 DM-i申报照曝光 或7月底上市 价格充满惊喜

网易汽车 浏览 9055 06-24

争议!库里中国行女球迷光脚欲冲进场 遭安保人员一把抱住拦截

醉卧浮生 浏览 564 08-19

被落石砸亡司机家属向政府索赔百万遭网暴 当事人回应

极目新闻 浏览 1027 07-15
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11