关闭广告

OpenAI、Anthropic互评:GPT存在谄媚行为,Claude不易出现幻觉”

IT之家2025-08-28 12:00:01530人阅读

IT之家 8 月 28 日消息,据外媒 Engadget 今日报道,OpenAI 和 Anthropic 共同宣布,同意评估彼此公开系统的安全对齐情况,并共享分析结果。总体来看,两家公司产品各有缺陷,也提供了改进未来安全测试的思路。


Anthropic 表示,它评估了 OpenAI 模型在谄媚、告密、自我保护、支持人类滥用,以及破坏 AI 安全评估和监管相关能力方面的表现。评估显示,OpenAI 的 o3 和 o4-mini 模型表现与 Anthropic 自家模型一致,但 GPT-4o 和 GPT-4.1 通用模型可能存在被滥用的风险。除 o3 外,其他测试模型在一定程度上都存在谄媚行为

Anthropic 的测试未包含 OpenAI 最新发布的 GPT-5。GPT-5 配备 Safe Completions 功能,旨在保护用户和公众免受潜在危险查询的影响。据IT之家近期的报道,OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自杀计划而最终自杀,面临首起不当死亡诉讼。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

华为无线鼠标优享版开售:支持星闪技术,售价 59 元

IT之家 浏览 381 10-14

山东一养殖场现炭疽病例,炭疽有多可怕?会人传人吗?

网易健康 浏览 8539 08-03

机构:暑期外国游客机票预订量遍布中国144个城市

北京商报 浏览 526 08-20

伊姐周日热推:电视剧《重影》;电视剧《山河枕》......

伊周潮流 浏览 268 10-27

41号秀力压多位首轮秀!23分钟10中7轰19+3 美媒:双向签顶级投手

颜小白的篮球梦 浏览 1690 07-12

秦岚自曝身体出现情况,治疗结果不尽人意

乡野小珥 浏览 233 03-03

马上测丨充会员也不能免广告!实测:五款视频APP各有套路

澎湃新闻 浏览 2715 08-13

5年长出一个日本,这就是中国力量!

华商韬略 浏览 3328 07-12

风控、资负端迎“大考”,复星保德信人寿高管换防能否翻新篇?

Daily每日财报 浏览 9024 07-28

利润激增200%,半导体巨头,护城河太深!

飞鲸投研 浏览 298 02-03

别再骂王菲了!10年匿名捐款超3000万

妙知 浏览 318 01-20

“李佳琦的没落”是假象,他难道还是“直播界的真王”?

财视传播 浏览 1618 08-13

双曲线一号遥十运载火箭发射成功

上观新闻 浏览 10303 07-31

郭德纲没想到岳云鹏竟给曹云金做了“嫁衣”

一家说 浏览 5913 08-10

一波三连胜杀进四强,上周,尼敦坚赞创2025最佳战绩

网球之家 浏览 1057 07-31

网友称在饭店吃饭被男子骚扰店家在旁观望 警方已介入

红星新闻 浏览 9966 08-10

特朗普称把俄乌达成和平协议期限缩短为10天

浏览 148363 09-26

6000万镑签7年记者独家:切尔西与莱比锡就西蒙斯达全面协议

直播吧 浏览 4991 08-07

同期超女赚大钱,黄雅莉却开二手卡车收破烂,到底图啥?

娱乐白名单 浏览 9802 08-10

埃杜-加西亚:接下来5场是决战,尽可能多拿分完成我们的保级目标

直播吧 浏览 391 09-22

机器狗浇花、机器人越野:这比赛比综艺还好看

36氪 浏览 175 12-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11