关闭广告

OpenAI、Anthropic互评:GPT存在谄媚行为,Claude不易出现幻觉”

IT之家2025-08-28 12:00:01222人阅读

IT之家 8 月 28 日消息,据外媒 Engadget 今日报道,OpenAI 和 Anthropic 共同宣布,同意评估彼此公开系统的安全对齐情况,并共享分析结果。总体来看,两家公司产品各有缺陷,也提供了改进未来安全测试的思路。


Anthropic 表示,它评估了 OpenAI 模型在谄媚、告密、自我保护、支持人类滥用,以及破坏 AI 安全评估和监管相关能力方面的表现。评估显示,OpenAI 的 o3 和 o4-mini 模型表现与 Anthropic 自家模型一致,但 GPT-4o 和 GPT-4.1 通用模型可能存在被滥用的风险。除 o3 外,其他测试模型在一定程度上都存在谄媚行为

Anthropic 的测试未包含 OpenAI 最新发布的 GPT-5。GPT-5 配备 Safe Completions 功能,旨在保护用户和公众免受潜在危险查询的影响。据IT之家近期的报道,OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自杀计划而最终自杀,面临首起不当死亡诉讼。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

蒯曼3-1击败何卓佳,晋级WTT欧洲大满贯瑞典站女单16强

直播吧 浏览 254 08-20

释永信被查当日 其师傅释行正"恭贺"他的纪念碑被遮挡

第一财经资讯 浏览 1780 07-31

OPPO AI战略曝光!全场景、全链路,要把 AI 做成系统?

雷科技 浏览 100 10-16

泰国军方:泰柬边境冲突第5天 柬方彻夜开火

界面新闻 浏览 7096 07-29

阿斯:安东尼将首发出战莱万特,他上一次比赛还是欧协联决赛

懂球帝 浏览 188 09-11

隐婚生子风波后,王鸥再被曝猛料!

通鉴史智 浏览 1531 07-16

E句话| 失踪的男演员已经被找到?

仙女事件簿 浏览 200 09-08

iPhone 17发售 郑州富士康急聘工人:返费最高8000元

红星新闻 浏览 155 09-12

落石砸车致司机身亡家属向政府索赔百万 遗体尚未安葬

极目新闻 浏览 6432 07-14

国家级5G智慧工厂背书,全新深蓝S07上市交付

经济观察报 浏览 150 09-22

媒体:国内没讨到好国外也没讨到好 石破茂辞职不突然

新民周刊 浏览 244 09-08

中国探月工程20周年系列展览上海开幕 科技与公益同行

东方网 浏览 4369 07-17

美关税持续冲击,日本7月出口创四年多最大跌幅

国际金融报 浏览 262 08-21

《生万物》播放过半,最令人讨厌角色出炉,干的事,个个离谱

娱乐圈笔娱君 浏览 266 08-17

尤文跟队记者:马竞对冈萨雷斯的报价约为总价2100万到2200万欧

直播吧 浏览 216 09-01

塔帅:哲凯赖什明天可能会出场;新赛季目标是比上赛季更好

懂球帝 浏览 10191 07-31

黄仁勋再度减持英伟达22.5万股 价值约3640万美元

证券时报 浏览 8455 07-12

万达集团所持94亿元股权被冻结 并被执行6664.66万

界面新闻 浏览 190 09-06

沪指再创年内新高,4000点还会是梦吗?

郭施亮 浏览 5323 07-31

NASA要在月球上建核反应堆 目标计划2030年前实现

每日经济新闻 浏览 23123 08-08

上年纪的女人,别总穿运动鞋和恨天高,这样穿鞋子得体又优雅

静儿时尚达人 浏览 157 09-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11