关闭广告

OpenAI新幻觉论文惹争议!GPT-5拉胯是测试基准有问题??

量子位2025-09-10 00:00:02380人阅读

henry 发自 凹非寺
量子位 | 公众号 QbitAI

OpenAI好不容易发了篇新论文,还是给GPT-5挽尊?

最近,《语言模型为何会产生幻觉?》这篇论文火了。

它提出模型有幻觉是因为:标准的训练和评估流程,更倾向于奖励“猜对”,而非承认不确定

正因如此,模型在面对不确定的问题时,往往会选择冒险猜测以获得更高评分。



所以,为了让模型“老实说不”,就应该重新设计评估指标,从而鼓励模型承认自己不会,惩罚随意猜测

而好巧不巧的是,OpenAI自家的GPT-5就最不爱猜测

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

波及多位明星!黄奕翻车前夫爆料被扒,7个瓜有4个被证实是真的

萌神木木 浏览 9073 08-11

图灵AI智驾+满血版AI天玑系统赋能,小鹏MONA M03 Max升级亮相!

环球汽车网官方 浏览 465 05-21

群核科技,摸着李飞飞过河

极客公园 浏览 191 12-16

死磕影像十一年:vivo探索另一种可能

远川研究所 浏览 268 10-16

“飞行的五角大楼”抵达华盛顿附近:沿不寻常的航线

红星新闻 浏览 5560 06-20

普京向特朗普提出俄乌停火四项条件

界面新闻 浏览 384 08-23

直播吧X咪咕体育 英超第2轮MVP评选参与投票赢取评论赢好礼

直播吧 浏览 420 08-26

全球首搭地平线6P+HSD 奇瑞星纪元E05设计稿曝光

网易汽车 浏览 4464 07-16

详解德天空:杰克逊1650万欧租借 若强买触发则6500万欧+二转

直播吧 浏览 410 09-02

中国科大、武大联合成功研制微型化紫外光谱仪芯片

IT之家 浏览 312 10-02

菲律宾总统府附近发生骚乱 49名示威者被捕

环球网资讯 浏览 342 09-23

“滴滴助学计划”高考奖学金公布获奖名单

网易科技报道 浏览 371 09-11

华为Pura80数字版将开售,比上代降价近千元

观察者网 浏览 7345 07-24

2026款奥德赛杀疯了!IQS夺冠 + 配置换血,18万落地稳赚不赔

吴佩频道 浏览 328 09-12

NBA球星生涯总薪水排名:詹姆斯5.83亿居首 布克乔治已超杜兰特

罗说NBA 浏览 10346 08-13

程强:市场延续回暖走势

首席经济学家论坛 浏览 199 10-23

广东千亿农商行拟再收编1家亏损村行,全省今年11家已被解散或合并

湘财Plus 浏览 2271 07-25

"6名学生遇难"事发时5块格栅板坠落 参观通道仅1米宽

每日经济新闻 浏览 5033 07-26

长安启源全新Q05:10万级配激光雷达和小蓝灯

网易汽车 浏览 445 08-11

FDA揭开药企“遮羞布”

虎嗅APP 浏览 3487 07-15

德国是否提供“金牛座”导弹援乌陷入真假疑云

环球网资讯 浏览 1970 05-28
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11