关闭广告

武汉大学让AI学会诊断金融知识:像医生检查身体一样评估AI模型

科技行者2025-09-10 00:00:02373人阅读


这项由武汉大学人工智能学院的谢倩倩教授领导的研究团队在2025年8月发表,论文题为《From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models》,该研究首次将教育心理学中的认知诊断理论引入到金融AI评估领域。有兴趣深入了解的读者可以通过GitHub项目页面https://github.com/WHUNextGen/FinCDM访问完整研究成果。

当我们去医院体检时,医生不会只告诉你"身体状况70分"就完事,而是会详细检查你的心脏、肝脏、肺部各个器官的具体情况,告诉你哪里健康、哪里需要注意。但令人意外的是,在评估金融AI模型时,我们却一直在用那种简单粗暴的"总分"方式。

考虑这样一个场景:两个学生都考了80分,但一个是因为数学好语文差,另一个是语文好数学差。如果只看总分,我们永远不知道该给他们推荐什么样的补习班。武汉大学的研究团队发现,评估金融AI模型时也存在完全相同的问题。目前所有的评估方法都只给出一个总体得分,比如"在金融问答任务上准确率85%",但这个分数完全无法

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

两件大事刷屏!“924行情”即将一周年,下周市场会修复吗?

每经牛眼 浏览 332 09-22

18万多落地买次低配,一汽丰田亚洲龙行情导购

郝车来袭 浏览 357 09-06

巴西欲拉金砖国家"群聊" 共商应对美国关税"大棒"

第一财经资讯 浏览 341 09-05

E句话 | 她还能和前夫复合?

仙女事件簿 浏览 2142 08-06

成都蓉城官方:高度重视徐正源教练发言 正与教练及其团队沟通协商

直播吧 浏览 2726 07-18

广州一模特疑被骗至缅甸遭非法拘禁 中使馆:加紧调查

北京青年报-北京头条 浏览 4740 07-04

北京大学联合多所知名高校突破机器人视角转换技术

科技行者 浏览 196 11-09

美财长:世界经济最大风险就是99%高端芯片在台湾生产

澎湃新闻 浏览 440 09-26

鲁加尼告别图多尔:真正的男人,永不言弃,谢谢您的一切

懂球帝 浏览 253 10-29

普陀区“十四五”成绩:财政收入年均增长10.8%!生产总值比“十三五”末增长40.8%!

国际金融报 浏览 358 09-11

俄军考虑放弃唯一航母 其或被切割成金属作废物利用

扬子晚报 浏览 1678 07-12

股价创一年来新高,李斌回应全新ES8定价低于老款太多,毛利仍有空间

红星资本局 浏览 418 08-23

莱万特3-0大胜塞维利亚,卡洛斯-阿尔瓦雷斯、卡洛斯-埃斯皮破门

懂球帝 浏览 214 01-05

规模突破4000亿!债券ETF,1个月涨了1000亿!

券商中国 浏览 8182 07-14

35家A股上市银行年度分红密集落地

商业观察杂志社 浏览 907 07-15

内外细节调整 新款日产奇骏官图发布

车质网 浏览 384 08-22

风水轮流转!赵薇75岁母亲近况被曝:当年多风光,如今就有多落魄

新语爱八卦 浏览 1175 08-13

波兰称考虑禁止中国电动汽车进入其军事基地 中方回应

财联社 浏览 191 01-20

恭喜,今年暑期档最大赢家,终于出现了

独立鱼 浏览 449 08-20

泽连斯基任命乌无人系统部队新司令 其曾是商界大佬

红星新闻 浏览 4454 06-05

记者:尽管与热刺和切尔西传出绯闻,但托尼1月不会返回英超

懂球帝 浏览 272 10-15
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11