关闭广告

OpenAI、Anthropic互评:GPT存在谄媚行为,Claude不易出现幻觉”

IT之家2025-08-28 12:00:01223人阅读

IT之家 8 月 28 日消息,据外媒 Engadget 今日报道,OpenAI 和 Anthropic 共同宣布,同意评估彼此公开系统的安全对齐情况,并共享分析结果。总体来看,两家公司产品各有缺陷,也提供了改进未来安全测试的思路。


Anthropic 表示,它评估了 OpenAI 模型在谄媚、告密、自我保护、支持人类滥用,以及破坏 AI 安全评估和监管相关能力方面的表现。评估显示,OpenAI 的 o3 和 o4-mini 模型表现与 Anthropic 自家模型一致,但 GPT-4o 和 GPT-4.1 通用模型可能存在被滥用的风险。除 o3 外,其他测试模型在一定程度上都存在谄媚行为

Anthropic 的测试未包含 OpenAI 最新发布的 GPT-5。GPT-5 配备 Safe Completions 功能,旨在保护用户和公众免受潜在危险查询的影响。据IT之家近期的报道,OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自杀计划而最终自杀,面临首起不当死亡诉讼。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

鲁比奥回应石破茂主张"摆脱对美依赖":美日关系很稳固

环球网资讯 浏览 8447 07-13

男生带妈妈跨越700公里参加毕业典礼:想有妈妈参与

极目新闻 浏览 6010 06-24

G联盟MVP戴维森和火箭签的1年双向合同 这是其可签双向的最后一季

直播吧 浏览 7835 07-27

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者 浏览 44 11-11

男子强奸大嫂出狱后刺死见义勇为者 被害人儿子发声

潇湘晨报 浏览 9203 07-24

Meta研究团队推出MLGym:让AI学会做科学研究的"训练场"

科技行者 浏览 232 08-27

科森科技被动开心

富凯财经 浏览 276 08-24

第一美人,只露了半张脸,天就塌了

Yuki女人故事 浏览 4983 07-23

速卖通正在成为更多亚马逊商家的第一阵地

华尔街见闻官方 浏览 106 10-16

35岁李心艾在陕西产女,婆婆跟妈妈同框像母女

一娱三分地 浏览 9884 08-07

“最丑女星”逆袭百亿富豪!她凭啥赢到底?

椰奶盖纸杯 浏览 200 09-08

最近孩子咳嗽要警惕!

网易健康 浏览 1486 11-15

互斥!阿斯:姆维二人相互几乎不传球,阿隆索需兼容不和睦的天才

直播吧 浏览 7613 07-21

美国务院批准向波兰出售“标枪”导弹系统

国际在线 浏览 132 09-19

58岁工地大叔在人民日报撰文:读书 把自己弄得好一点

北京日报客户端-长安街知事 浏览 843 07-12

媒体报道男子拒付52万婚宴食材款被诉 当事人:遭网暴

澎湃新闻 浏览 8453 08-11

第138届广交会10月15日开幕,约3600家企业首亮相,首设智慧医疗专区

红星资本局 浏览 94 10-11

央行重磅发声!资金“活水”助力企业逆势增长,中小微企业贷款迎来重大利好,速看!

杠杆游戏 浏览 245 08-25

黄金“疯狂”背后,资金已有分歧

第一财经资讯 浏览 209 09-11

出游这样穿!《花少7》那英、马思纯从发型到穿搭,实用又出片

黎贝卡的异想世界 浏览 171 09-16

官方:升班马克雷莫纳签下莱切后卫巴斯奇罗托,转会费300万欧

直播吧 浏览 5009 07-30
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11