关闭广告

OpenAI、Anthropic互评:GPT存在谄媚行为,Claude不易出现幻觉”

IT之家2025-08-28 12:00:01420人阅读

IT之家 8 月 28 日消息,据外媒 Engadget 今日报道,OpenAI 和 Anthropic 共同宣布,同意评估彼此公开系统的安全对齐情况,并共享分析结果。总体来看,两家公司产品各有缺陷,也提供了改进未来安全测试的思路。


Anthropic 表示,它评估了 OpenAI 模型在谄媚、告密、自我保护、支持人类滥用,以及破坏 AI 安全评估和监管相关能力方面的表现。评估显示,OpenAI 的 o3 和 o4-mini 模型表现与 Anthropic 自家模型一致,但 GPT-4o 和 GPT-4.1 通用模型可能存在被滥用的风险。除 o3 外,其他测试模型在一定程度上都存在谄媚行为

Anthropic 的测试未包含 OpenAI 最新发布的 GPT-5。GPT-5 配备 Safe Completions 功能,旨在保护用户和公众免受潜在危险查询的影响。据IT之家近期的报道,OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自杀计划而最终自杀,面临首起不当死亡诉讼。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

只待官宣!欧篮记者:霍顿-塔克与费内巴切签下1年100万美元合同

直播吧 浏览 325 09-02

洪森回击他信言论:奉陪到底 是佩通坦先对我进行侮辱

看看新闻Knews 浏览 4059 07-16

本次国际比赛日迎国家队首秀阵:埃基蒂克领衔,埃斯波西托在列

直播吧 浏览 316 09-11

重磅引援!洛杉矶FC社媒晒孙兴慜加盟发布会照片,展示7号球衣

直播吧 浏览 4889 08-07

天价耳环黄杨钿甜复出,高考造假那尔那茜没下文,天龙人何时休

不八卦会死星人 浏览 389 08-24

罗永浩质疑大金中央空调;摩尔线程首款AI电脑发布丨邦早报

创业邦 浏览 170 12-21

黄金有关税收新政落地首周,市场各方反应如何?

中国商报 浏览 205 11-09

路易斯:感到很失望,明年我不知道还会不会在这里

懂球帝 浏览 232 10-27

智能体崛起、算力突围,WAIC 2025开启AI“超进化”

国际金融报 浏览 9115 07-29

拜仁高层:希望凯恩长期为拜仁效力

体坛周报 浏览 334 09-29

米体:罗马全力追求卡拉斯科,已向利雅得青年提交首份报价

懂球帝 浏览 182 01-23

扣非净利润暴跌944.18%!光学巨头欧菲光上半年再度亏损

国际金融报 浏览 418 08-20

特朗普宣布将对进口建材、家具及药品实施高额关税

界面新闻 浏览 292 09-26

敖瑞鹏是真出息了,《朝雪录》拿下收视第一,中式恐怖成全剧亮点

最爱酷影视 浏览 5137 07-21

WCBA全明星正赛投票结果&首发球员名单出炉,杨力维当选票王

懂球帝 浏览 104 03-17

辛纳夺冠完全是运气加持?卡希尔:有运气,但当时状态越来越好

网球之家 浏览 2030 07-17

全新速腾将上市,对比现款车型,等新还是买旧?

优视汽车 浏览 438 06-02

阿里联合上海交大:一个训练样本就能让AI变"学霸"的惊人发现

科技行者 浏览 199 01-13

这些才是普通人适合的穿搭!衣服不夸张、配色不鲜艳,大方又得体

静儿时尚达人 浏览 8861 06-08

牛弹琴:中美领导人通话谈台湾问题 特朗普比较清醒

北京日报客户端 浏览 256 11-25

还在磨合纽卡夏窗花近2.8亿欧,英超开局仅1胜3平1负排第13

直播吧 浏览 338 09-22
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11