参考指南

IT之家 8 月 28 日消息，据外媒 Engadget 今日报道，OpenAI 和 Anthropic 共同宣布，同意评估彼此公开系统的安全对齐情况，并共享分析结果。总体来看，两家公司产品各有缺陷，也提供了改进未来安全测试的思路。

Anthropic 表示，它评估了 OpenAI 模型在谄媚、告密、自我保护、支持人类滥用，以及破坏 AI 安全评估和监管相关能力方面的表现。评估显示，OpenAI 的 o3 和 o4-mini 模型表现与 Anthropic 自家模型一致，但 GPT-4o 和 GPT-4.1 通用模型可能存在被滥用的风险。除 o3 外，其他测试模型在一定程度上都存在谄媚行为。

Anthropic 的测试未包含 OpenAI 最新发布的 GPT-5。GPT-5 配备 Safe Completions 功能，旨在保护用户和公众免受潜在危险查询的影响。据IT之家近期的报道，OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自杀计划而最终自杀，面临首起不当死亡诉讼。

OpenAI、Anthropic互评：GPT存在谄媚行为，Claude不易出现幻觉”

7月最值得看...

记者：梅西在...

理想汽车服务...

独家版本首度...

国防部长董军...

晚点独家丨千...

两融余额时隔10年突破2.1万亿元

广发基金固收+领跑、规模优势提升还有短板待补

官网四大板块系业务分类更新，阿里组织架构调整被指乌龙｜快讯

国盾量子董事长吕品去世：上任半年多年仅46岁

罗斯、威少、沃尔、莫兰特，四大野兽控卫谁的身体天赋最逆天？

俄安-24客机坠毁事件完成调查

官方：纽卡后卫刘易斯-米利当选英联杯1/4决赛最佳球员

带火今年最热门的鞋，杨幂合影也要靠边站，这位“漂亮脸蛋”到底什么来头？

解除留置，浙大博导恢复工作，2.6亿所得合法合规

北上广深家长悟了！花300多万卷教育，不如给孩子规划一辈子“底薪”！

ClickHouse挑战Snowflake，蹭上AI东风 | 企服国际观察

对话联想ISG黄山：异构算力融合将成为AI应用落地的关键丨ToB产业观察

大模型与机器人互促共进的当下，他们想要共筑世界的“新终端”

大众汽车重组电动车战略，目标是对抗特斯拉与比亚迪！

再胜委内瑞拉通道采访！廖三宁强调防守，赵睿回应热身价值与磨合

疑因允许在航母上办变装秀美军第七舰队司令提名被撤

官方：切尔西19岁前锋杰伊-摩根租借至英甲彼得堡联租期一个赛季

今年丢人了……

缔造仙女梦的人，去了天堂继续缝制星光✨

媒体：遭美国＂羞辱＂后莫迪时隔7年再访华

三伏将至，阳气最旺！如何趁热打＂贴＂？

200亿广州知名国企，董事长总经理先后换将，人均薪酬超过20万

芯片制造的终极范式：原子级制造

人均100吃出上千仪式感！“板前模式”爆发了