关闭广告

武汉大学让AI学会诊断金融知识:像医生检查身体一样评估AI模型

科技行者2025-09-10 00:00:02434人阅读


这项由武汉大学人工智能学院的谢倩倩教授领导的研究团队在2025年8月发表,论文题为《From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models》,该研究首次将教育心理学中的认知诊断理论引入到金融AI评估领域。有兴趣深入了解的读者可以通过GitHub项目页面https://github.com/WHUNextGen/FinCDM访问完整研究成果。

当我们去医院体检时,医生不会只告诉你"身体状况70分"就完事,而是会详细检查你的心脏、肝脏、肺部各个器官的具体情况,告诉你哪里健康、哪里需要注意。但令人意外的是,在评估金融AI模型时,我们却一直在用那种简单粗暴的"总分"方式。

考虑这样一个场景:两个学生都考了80分,但一个是因为数学好语文差,另一个是语文好数学差。如果只看总分,我们永远不知道该给他们推荐什么样的补习班。武汉大学的研究团队发现,评估金融AI模型时也存在完全相同的问题。目前所有的评估方法都只给出一个总体得分,比如"在金融问答任务上准确率85%",但这个分数完全无法

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

邓炳强称火势蔓延过快不寻常 事发楼栋居民发声

经济观察报 浏览 423 11-27

像素蛋糕推出摄影行业首个AI一体化方案:一体化智能工作流

网易科技报道 浏览 4135 07-17

俄客机在阿穆尔州失联 载有43名乘客和6名机组成员

CCTV国际时讯 浏览 3173 07-25

7月小型SUV销量TOP20揭晓:仅两款破万 元UP夺冠

智车情报局 浏览 511 08-19

文淇签约陈坤周迅舒淇公司,成为张婧仪同事

师维 浏览 267 02-05

特斯拉官宣,这款车售价下调至25.95万元!

每日经济新闻 浏览 525 09-01

纳指创历史新高 芯片股多数上涨 36氪大涨92.75%

中新经纬 浏览 400 09-09

媒体:与多国领导人关系微妙之际 特朗普或下月访韩

上观新闻 浏览 555 09-08

小扎千亿新模型被曝「套壳」Qwen!Meta开源已成笑话

新智元 浏览 288 12-11

企业悬赏百万征集公职人员违法线索 对方起诉索赔百万

极目新闻 浏览 568 08-20

哈马斯称积极回应停火提案 以媒披露协议细节

极目新闻 浏览 3247 07-06

盲人因带导盲犬爬泰山被骂"虐狗":不想连累老板已辞职

新京报 浏览 469 10-01

男子称入住酒店发现床单有血迹要求退一赔三 酒店回应

潇湘晨报 浏览 628 08-12

中乌外交部政治磋商在北京举行

界面新闻 浏览 303 12-20

何聪睿剧扑甩锅女主,本人发声道歉

扒虾侃娱 浏览 308 01-21

黄仁勋警示AI风险:没新想法,就集体失业

网易科技报道 浏览 2131 07-12

特朗普称早已经与爱泼斯坦断交:他不止一次"背叛"我

环球网资讯 浏览 7825 07-30

今年夏天“微透风”火出圈了,这样穿时髦松弛又减龄

LinkFashion 浏览 6402 07-04

兰博基尼 CEO 温科尔曼称至少十年内不会放弃内燃机

IT之家 浏览 333 10-22

"胖兵照"浏览量超过3000万 数据显示美军肥胖率超20%

红星新闻 浏览 341 10-15

工业边缘AI计算赛道升温,设备与芯片厂商抢占风口

21世纪经济报道 浏览 380 09-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11