关闭广告

斯坦福大学团队推出「许可证神谕」:让AI学会说「我不知道」

科技行者2026-01-23 00:00:01286人阅读


当你向ChatGPT询问某位哲学家的出生日期时,它总是信心满满地给出答案,哪怕这个答案完全错误。这种现象被研究者称为「幻觉」,就像AI患了妄想症,总是编造一些听起来很有道理但实际上完全错误的信息。来自加州圣迭戈RA软件公司的理查德·阿克曼和保加利亚索菲亚大学的西蒙·埃马努伊洛夫在2025年发表的这项研究,提出了一个革命性的解决方案——「许可证神谕」系统。

这项研究发表在2025年的学术期刊上,研究者通过设计一种全新的架构,让AI在回答问题前必须先检验自己的答案是否正确,就像给AI装上了一个严格的「事实核查员」。研究团队在实验中取得了惊人的成果:传统方法只能达到56.7%的准确判断率,而他们的系统达到了完美的100%准确率,完全消除了虚假答案的产生。

研究者首先深入分析了AI产生幻觉的根本原因。在他们之前发表的研究《大型语言模型是如何被设计来产生幻觉的》中,研究团队指出,这个问题并非来自训练数据不足或模型调优不当,而是源于变换器架构本身的局限性。变换器模型就像一个只会模仿的学生,它能够生成语法正确、听起来合理的句子,但缺乏验证这些句子是否符合事实的能力。研究者将这种现象比作「平面语义空间」,在这个空间中

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

不少老人宁愿挨冻也不敢开暖气,让人痛心!河北农村取暖问题,不能再耽搁了

每日经济新闻 浏览 292 01-06

美网正赛中国8人入围:张帅王曦雨资格赛突围 女单6人男单2人

醉卧浮生 浏览 519 08-23

新兴市场套利狂潮未止!华尔街看好2026年高收益货币前景

智通财经 浏览 251 12-15

北青:新加坡籍国际级裁判塔基很可能将执法上海德比

懂球帝 浏览 3338 08-07

神奇少帅诞生!陈涛2战6分上岸,媒体人狂赞:比不靠谱洋帅强多了

奥拜尔 浏览 358 10-25

全球红人经济“超级枢纽”!天下秀递表港交所,新浪微博持股近27%|港E声

时代周报 浏览 296 01-07

陈涛:我们最后四轮赛程可以用地狱级来形容,已经没有退路了

懂球帝 浏览 383 10-13

我国高原大型无人机物流航线首次验证飞行成功,北川成关键落地节点

红星新闻 浏览 328 01-15

帕金斯:东契奇已准备好承担责任 我打赌他将拿到下赛季MVP

直播吧 浏览 6969 07-26

图片报:皇萨塔、曼联、拜仁、药厂、多特等球队关注艾希霍恩

懂球帝 浏览 183 04-10

徐嘉余晋级游泳世锦赛男子100米仰泳半决赛,汪顺止步预赛

直播吧 浏览 3441 07-28

记者:哥伦比亚小将马丁内斯的未来将在几天内敲定

懂球帝 浏览 169 04-22

知情人士回应:Manus一切正常

虎嗅APP 浏览 5397 07-14

李连杰换硬件续命!?

八卦疯叔 浏览 473 08-18

伊姐周日热推:访谈《陈鲁豫·漫谈》;电视剧《目之所及》......

伊周潮流 浏览 520 09-01

一周AI大事:Grok 4硬刚GPT-5,英伟达破纪录

网易科技报道 浏览 7097 07-14

WAIC前线|声网发布新版对话式 AI 引擎,集成声纹识别、数字人与视觉理解功能

网易科技报道 浏览 6566 07-29

涉案1.4亿元!某短视频平台员工被曝内外勾结骗取补贴奖励金,通过比特币等洗白资金

澎湃新闻 浏览 8137 07-26

但丁《神曲》的爱与救赎,在700年后迎来了答案

时尚COSMO 浏览 3300 08-06

惨!武术冠军自掏腰包拍武侠片,成本超1500万,4天票房仅169万

靠谱电影君 浏览 373 10-22

金正恩结束对中国访问 乘专列离京返程

界面新闻 浏览 382 09-05
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11