关闭广告

OpenAI、Anthropic互评:GPT存在谄媚行为,Claude不易出现幻觉”

IT之家2025-08-28 12:00:01425人阅读

IT之家 8 月 28 日消息,据外媒 Engadget 今日报道,OpenAI 和 Anthropic 共同宣布,同意评估彼此公开系统的安全对齐情况,并共享分析结果。总体来看,两家公司产品各有缺陷,也提供了改进未来安全测试的思路。


Anthropic 表示,它评估了 OpenAI 模型在谄媚、告密、自我保护、支持人类滥用,以及破坏 AI 安全评估和监管相关能力方面的表现。评估显示,OpenAI 的 o3 和 o4-mini 模型表现与 Anthropic 自家模型一致,但 GPT-4o 和 GPT-4.1 通用模型可能存在被滥用的风险。除 o3 外,其他测试模型在一定程度上都存在谄媚行为

Anthropic 的测试未包含 OpenAI 最新发布的 GPT-5。GPT-5 配备 Safe Completions 功能,旨在保护用户和公众免受潜在危险查询的影响。据IT之家近期的报道,OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自杀计划而最终自杀,面临首起不当死亡诉讼。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普称将用波音747当"空军一号":由卡塔尔王室赠送

界面新闻 浏览 6270 05-12

艾弗森怒斥轮休:让我轮休?那xx是一场比赛,有种训练也让我休息好了

懂球帝 浏览 267 10-13

贵州茅台股东大会发放“定心丸”成效几何

北京商报 浏览 266 11-10

韩媒:签约布莱顿后,18岁韩国球员尹棹泳外租至荷甲SBV精英

直播吧 浏览 7963 07-14

让智驾能看懂真实世界 英伟达发布开源Alpamayo平台

网易汽车 浏览 208 01-07

智界双设计中心正式开业 智界品牌迎来2.0模式

网易汽车 浏览 6807 08-08

弗里克:全力以赴比赛是我们的目标,但这要取决于球员们的表现

直播吧 浏览 446 08-24

阿鲁纳:我自费参加世乒赛,尼日利亚从未提供过任何支持

懂球帝 浏览 351 09-10

汽车图谱㉔|1月车市调整:上汽销量居首,吉利逆势增长

贝壳财经 浏览 159 02-03

小S复出之路艰难!电视台避谈具体时间

萌神木木 浏览 2853 08-09

特斯拉终于用上了国产大模型!豆包和DeepSeek上车

车东西 浏览 431 08-23

92岁陶玉玲去世,身患3癌丧女又丧夫

疯说时尚 浏览 180 01-16

上市车企半年考:民营车企成行业赚钱主力 老牌国企受累于合资?

道哥说车 浏览 419 09-04

将人分为"安卓人"和"苹果人" 网红户晨风账号全网封禁

扬子晚报 浏览 321 10-02

日媒总结世锦赛:亚洲唯一4强 险击败豪门巴西 23岁佐藤王牌潜质

颜小白的篮球梦 浏览 393 09-09

股价五年涨五倍,“老股王”汇丰控股重现风光

达摩财经 浏览 486 08-23

被瑞幸冲击,星巴克撑不下去了……

功夫财经 浏览 250 11-08

超频三 RT620Pro TC ARGB 风冷 239 元上市,配备家族化一体顶盖

IT之家 浏览 311 10-11

大幅上调英伟达目标价,这家大行的理由:台积电产能分配远超预期,OpenAI“闭环交易”

华尔街见闻官方 浏览 315 10-16

俄乌冲突僵局难破,和平之路荆棘满布

浏览 4237 07-14

德米纳尔救赛点夺第十冠,90后冠军数排行榜上能列第几?

网球之家 浏览 3090 07-30
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11