参考指南

IT之家 8 月 28 日消息，据外媒 Engadget 今日报道，OpenAI 和 Anthropic 共同宣布，同意评估彼此公开系统的安全对齐情况，并共享分析结果。总体来看，两家公司产品各有缺陷，也提供了改进未来安全测试的思路。

Anthropic 表示，它评估了 OpenAI 模型在谄媚、告密、自我保护、支持人类滥用，以及破坏 AI 安全评估和监管相关能力方面的表现。评估显示，OpenAI 的 o3 和 o4-mini 模型表现与 Anthropic 自家模型一致，但 GPT-4o 和 GPT-4.1 通用模型可能存在被滥用的风险。除 o3 外，其他测试模型在一定程度上都存在谄媚行为。

Anthropic 的测试未包含 OpenAI 最新发布的 GPT-5。GPT-5 配备 Safe Completions 功能，旨在保护用户和公众免受潜在危险查询的影响。据IT之家近期的报道，OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自杀计划而最终自杀，面临首起不当死亡诉讼。

OpenAI、Anthropic互评：GPT存在谄媚行为，Claude不易出现幻觉”

大额企业贷，...

在大陆淘金2...

高校男留学生...

孙济民｜从财...

2.3亿票房...

美公司掀创纪...

1家5口被失控车撞倒：爷爷离世遇难孩子刚幼儿园毕业

618大汇总|| 不乱买！精挑细选的超全功课都在这了

五连胜保持不败！萨林杰32+11广东双杀广州徐杰20+4断陈国豪8分

男子围猎多名女性自称是＂公务员＂有女子给他140万

速腾＂喷粉＂波及宝来车主：只能用透明胶带封住出风口

人工智能激发云计算订单释放相关基金重仓股大幅异动

美国德州仪器与优必选达成战略合作

毕马威：人工智能已成为推动中国产业升级与经济高质量发展的关键驱动力

卫报：切尔西不愿满足加纳乔的定价；雅克松的要价为8000万镑

被美围绕的一周：上课、逛家、看展

听歌入睡真的“治愈”么？

生物芯片上海国家工程研究中心四川分中心在成都揭牌

今日热点：曾艳芬提醒丝芭传媒有聊天记录；边伯贤恶评者被罚款……

杨蓉右脸烫伤后晒自拍：“带疤的脸很酷”

阿里、上汽孵化的斑马智行IPO！估值220亿却遭前CFO深夜炮轰

“毛衣+豆腐裤”绝美！冬天就该这么穿！

向上社交为何会失败？

业界最 256Gb 容量耐辐射 SLC，美光推首款太空认证 NAND 闪存

云南鸿蒙智行购车补贴启动：三界可享，每台补 3000 元

官方公布雀巢巴黎水丑闻调查：欺诈消费者

可坐4人的飞行汽车样车披露今年7月已在武汉试飞

787“梦想客机”首次致命空难波音再陷沼泽

他是著名演员，临终前也没听到儿子喊声爸？

沙特，一部活色生香的《一千零一夜》