关闭广告

香港科技大学团队发现形式化验证如何让AI推理更聪明

科技行者2026-02-04 00:00:01160人阅读


这是一个关于人工智能如何学会更好地思考的故事。想象一下,你在教一个聪明但有点"散漫"的孩子做数学题。这个孩子通常能猜对答案,但他的推理过程常常有漏洞——他会说"因为看起来对所以就对了",而不是真正理解为什么。如今,来自香港科技大学、上海人工智能实验室、浙江大学和香港浸会大学的研究团队发现了一个巧妙的办法,让这个"散漫的孩子"学会了像数学家一样严谨地思考。这项研究发表于2026年1月,论文编号为arXiv:2601.22642。

这个故事的核心很有趣:当今最强大的语言模型,比如ChatGPT和Claude,在处理复杂推理问题时,常常会犯一个致命的错误。它们会生成看似合理但逻辑上存在严重漏洞的答案。研究人员的发现更是令人担忧——即使在最终答案是对的情况下,推理过程中有39.3%的步骤在形式化验证中被"驳回"了。而当答案错误时,这个比例甚至高达52.4%。这就像一个学生虽然最后得到了正确答案,但他的计算过程完全是错的——纯粹是靠运气或者模式识别碰巧得对了。

研究团队的创新之处在于,他们不是简单地让AI生成答案就完事,而是在推理的每一步都加入了一个"严厉的数学老师"——形式化验证系统。这个"老师"会实时检查每

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

一波接着一波 吴京风波牵扯多位巨星

趣文说娱 浏览 64143 08-30

美股三大股指高开 纳指盘初涨0.87%

证券时报 浏览 194 10-25

中国峰会|奕斯伟计算以“产品+场景+生态协同”模式加速产业渗透

华商韬略 浏览 4779 07-18

欧锦赛头号夺冠热门!塞尔维亚主帅:这不是约基奇和博格丹的球队

罗说NBA 浏览 497 08-19

幕后英雄?跟队:弗兰克注重沟通,背后团队在比赛中通力合作

懂球帝 浏览 521 08-25

冬季穿衣别显得太臃肿!大衣收腰、搭配围巾,有质感又高级

静儿时尚达人 浏览 194 12-26

四川又一港股IPO!出货量全球第三的光伏黑马,张发玉家族掌舵、宜宾国资入股

红星资本局 浏览 485 08-23

前三季度应收账款激增603.71%,卤味巨头煌上煌靠收购和补贴撑利润?

时代周报 浏览 281 10-22

那天,AI大模型想起了,被「失忆」所束缚的枷锁

机器之心Pro 浏览 395 09-01

袭击事件连发 哥伦比亚全国部队进入一级戒备

环球网资讯 浏览 415 08-23

美媒热议"谁将成为特朗普的新科技密友" 多人被提及

环球网资讯 浏览 3683 06-06

“中国战狼”到“京学被嘲”?互联网解构吴京

桑葚爱动画 浏览 333 09-20

第一次做硬件,阿里先稳一手

钛媒体APP 浏览 6962 07-30

刘强东又拿下理想,京东汽车靠谱吗?

正在说车 浏览 196 12-28

郭富城追“子”成功,方媛孕肚被拍

温读史 浏览 9967 07-09

为什么中国卖水能出首富?美国富豪都在搞科技?

诗与星空 浏览 1274 07-28

3人救落水女子4人均遇难 救援人员:水情复杂还有旋涡

极目新闻 浏览 98 04-10

A股升温大额存单转让潮再现 有人4.65%利息都不要了

第一财经资讯 浏览 533 08-26

美股中概股集体大涨 蔚来涨超10%

证券时报 浏览 405 08-23

京东美团“疯抢”具身智能公司,要干什么

态℃ 浏览 4269 07-25

再见了卡梅隆,再见了《阿凡达3》,中国观众别再被骗了

娱乐圈笔娱君 浏览 180 12-24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11