关闭广告

OpenAI、Anthropic互评:GPT存在谄媚行为,Claude不易出现幻觉”

IT之家2025-08-28 12:00:01532人阅读

IT之家 8 月 28 日消息,据外媒 Engadget 今日报道,OpenAI 和 Anthropic 共同宣布,同意评估彼此公开系统的安全对齐情况,并共享分析结果。总体来看,两家公司产品各有缺陷,也提供了改进未来安全测试的思路。


Anthropic 表示,它评估了 OpenAI 模型在谄媚、告密、自我保护、支持人类滥用,以及破坏 AI 安全评估和监管相关能力方面的表现。评估显示,OpenAI 的 o3 和 o4-mini 模型表现与 Anthropic 自家模型一致,但 GPT-4o 和 GPT-4.1 通用模型可能存在被滥用的风险。除 o3 外,其他测试模型在一定程度上都存在谄媚行为

Anthropic 的测试未包含 OpenAI 最新发布的 GPT-5。GPT-5 配备 Safe Completions 功能,旨在保护用户和公众免受潜在危险查询的影响。据IT之家近期的报道,OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自杀计划而最终自杀,面临首起不当死亡诉讼。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

国盾量子董事长吕品去世:上任半年多 年仅46岁

时代周报 浏览 259 12-19

罗斯、威少、沃尔、莫兰特,四大野兽控卫谁的身体天赋最逆天?

仰卧撑FTUer 浏览 243 03-11

俄安-24客机坠毁事件完成调查

国际在线 浏览 402 08-21

官方:纽卡后卫刘易斯-米利当选英联杯1/4决赛最佳球员

懂球帝 浏览 312 01-13

带火今年最热门的鞋,杨幂合影也要靠边站,这位“漂亮脸蛋”到底什么来头?

黎贝卡的异想世界 浏览 9968 06-12

解除留置,浙大博导恢复工作,2.6亿所得合法合规

壹只灰鸽子 浏览 373 10-02

北上广深家长悟了!花300多万卷教育,不如给孩子规划一辈子“底薪”!

智谷趋势 浏览 6789 07-27

ClickHouse挑战Snowflake,蹭上AI东风 | 企服国际观察

钛媒体APP 浏览 2749 07-14

对话联想ISG黄山:异构算力融合将成为AI应用落地的关键丨ToB产业观察

钛媒体APP 浏览 496 08-19

大模型与机器人互促共进的当下,他们想要共筑世界的“新终端”

文汇报 浏览 857 07-28

大众汽车重组电动车战略,目标是对抗特斯拉与比亚迪!

郑谊 浏览 510 09-11

再胜委内瑞拉通道采访!廖三宁强调防守,赵睿回应热身价值与磨合

篮球资讯达人 浏览 1862 07-26

疑因允许在航母上办变装秀 美军第七舰队司令提名被撤

环球网资讯 浏览 3391 07-15

官方:切尔西19岁前锋杰伊-摩根租借至英甲彼得堡联 租期一个赛季

直播吧 浏览 454 09-02

今年丢人了……

越女事务所 浏览 424 08-21

缔造仙女梦的人,去了天堂继续缝制星光✨

黎贝卡的异想世界 浏览 277 01-21

媒体:遭美国"羞辱"后 莫迪时隔7年再访华

上观新闻 浏览 600 08-28

三伏将至,阳气最旺!如何趁热打"贴"?

人民网 浏览 12042 07-18

200亿广州知名国企,董事长总经理先后换将,人均薪酬超过20万

华美财经 浏览 4487 07-27

芯片制造的终极范式:原子级制造

钛媒体APP 浏览 399 10-16

人均100吃出上千仪式感!“板前模式”爆发了

餐饮老板内参 浏览 5810 07-28
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11