关闭广告

武汉大学让AI学会诊断金融知识:像医生检查身体一样评估AI模型

科技行者2025-09-10 00:00:02442人阅读


这项由武汉大学人工智能学院的谢倩倩教授领导的研究团队在2025年8月发表,论文题为《From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models》,该研究首次将教育心理学中的认知诊断理论引入到金融AI评估领域。有兴趣深入了解的读者可以通过GitHub项目页面https://github.com/WHUNextGen/FinCDM访问完整研究成果。

当我们去医院体检时,医生不会只告诉你"身体状况70分"就完事,而是会详细检查你的心脏、肝脏、肺部各个器官的具体情况,告诉你哪里健康、哪里需要注意。但令人意外的是,在评估金融AI模型时,我们却一直在用那种简单粗暴的"总分"方式。

考虑这样一个场景:两个学生都考了80分,但一个是因为数学好语文差,另一个是语文好数学差。如果只看总分,我们永远不知道该给他们推荐什么样的补习班。武汉大学的研究团队发现,评估金融AI模型时也存在完全相同的问题。目前所有的评估方法都只给出一个总体得分,比如"在金融问答任务上准确率85%",但这个分数完全无法

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:伊朗战争或成美国第一次不敢打接触战的战争

澎湃新闻 浏览 180 04-07

微软秘密武器亮相,英伟达CUDA护城河遭遇直接冲击

IT之家 浏览 279 11-10

中美AI豪赌:一个要“登天”,一个要“落地”

网易科技报道 浏览 485 09-01

杨洋《凡人修仙传》开播差评一片?理由出奇一致

娱乐圈笔娱君 浏览 7230 07-29

立威第一枪?巴拿马拿中资港口开刀,李嘉诚228亿落空?

数字财经智库 浏览 280 02-05

深度解读“碱基编辑技术”:首个定制基因编辑疗法案例获成功

DeepTech深科技 浏览 297 01-19

球场宣!洛杉矶FC主场大屏幕“官宣”:欢迎孙兴慜!洛杉矶FC前锋

直播吧 浏览 5179 08-06

国产都卷不赢的车 被一汽丰田用纯原创造出来了

路咖汽车 浏览 541 06-14

鸿蒙智行问界 M8 汽车连续 13 周登顶 40 万级周销榜冠军

IT之家 浏览 547 08-20

伊朗最高领袖哈梅内伊转入地堡 日常事务交由儿子接管

极目新闻 浏览 283 01-27

削减三成募资终迎上会审核之机,精创电气闯关北交所上市能否如愿

叩叩财讯 浏览 509 08-29

供应链首个自主AI Agent平台发布,迈入全链路自主决策阶段

澎湃新闻 浏览 3370 07-28

阿尔特塔:英超是欧冠决赛的预演?我不认为球员会这么想

懂球帝 浏览 110 05-09

NBA战报:活塞122-117步行者取NBA12连胜,西亚卡姆24分

懂球帝 浏览 287 11-25

苹果微软为何离不开中国?张维为:产业链的硬实力

看看新闻Knews 浏览 2344 07-13

单依纯演唱会再唱“区区三万天”宣战

凛若秋霜 浏览 148 04-29

Keychron 渴创推出猫爪巨轴单键键盘,39.99 美元

IT之家 浏览 508 08-20

4.9秒破百/505km续航 新款丰田bZ4X更名为丰田bZ

网易汽车 浏览 522 05-17

俄罗斯空袭美国工厂

上观新闻 浏览 456 08-22

美财长声称中方提出非常"激进"要求 外交部回应

外交部网站 浏览 530 09-16

标普纳指齐逼历史高位 “七巨头“财报将定调美股走向

智通财经 浏览 6964 07-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11