关闭广告

武汉大学让AI学会诊断金融知识:像医生检查身体一样评估AI模型

科技行者2025-09-10 00:00:02369人阅读


这项由武汉大学人工智能学院的谢倩倩教授领导的研究团队在2025年8月发表,论文题为《From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models》,该研究首次将教育心理学中的认知诊断理论引入到金融AI评估领域。有兴趣深入了解的读者可以通过GitHub项目页面https://github.com/WHUNextGen/FinCDM访问完整研究成果。

当我们去医院体检时,医生不会只告诉你"身体状况70分"就完事,而是会详细检查你的心脏、肝脏、肺部各个器官的具体情况,告诉你哪里健康、哪里需要注意。但令人意外的是,在评估金融AI模型时,我们却一直在用那种简单粗暴的"总分"方式。

考虑这样一个场景:两个学生都考了80分,但一个是因为数学好语文差,另一个是语文好数学差。如果只看总分,我们永远不知道该给他们推荐什么样的补习班。武汉大学的研究团队发现,评估金融AI模型时也存在完全相同的问题。目前所有的评估方法都只给出一个总体得分,比如"在金融问答任务上准确率85%",但这个分数完全无法

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

不必悲观!券商发声:相比4月,预计冲击更小!

证券时报e公司 浏览 329 10-13

保剑锋否认出轨传闻!陈年往事够精彩

凌风的世界观 浏览 215 12-15

俄罗斯对乌克兰发动最大规模无人机袭击

每日经济新闻 浏览 7126 07-11

46年来首次 埃及总统首次将以色列称为"敌人"

鲁中晨报 浏览 363 09-18

2天5个瓜!个个离谱

书雁飞史oh 浏览 346 09-09

“TVB第一美人”背后,她到底赢在了哪?

Yuki女人故事 浏览 360 09-07

送别聂卫平队伍长度超200米 韩国围棋名宿前来吊唁

极目新闻 浏览 199 01-19

26款奇瑞冰淇淋/小蚂蚁上市 报废双补价3.4万元起

网易汽车 浏览 197 01-11

换发型堪比整容?也要注意这一点才能不踩雷

黎贝卡的异想世界 浏览 7275 07-24

上海男子卖黄金卷入电诈案 收款8万元被河南警方划扣

澎湃新闻 浏览 7386 08-06

男子带病妻跑车 三个月收到200多张鼓励纸条贴满车顶

极目新闻 浏览 755 07-16

光伏幕墙+汽车反向供电,全球首个“超阶零碳建筑”在青岛启用

IT之家 浏览 445 08-24

夏季穿搭不用发愁,这27套造型值得照搬,优雅清爽又有回头率

静儿时尚达人 浏览 354 09-07

加州大学欧文分校发明"内部监控器":让大模型自己识别胡说八道

科技行者 浏览 165 02-05

记者谈马宁连出三红:密集出牌虽彰显权威,却也容易激化矛盾

懂球帝 浏览 249 10-13

韩国称朝鲜有2吨高浓缩铀足够制造大量核武 中方回应

北京日报 浏览 390 09-26

冯绍峰被曝新恋情,女方周麟嘉神似赵丽颖?

老吴教育课堂 浏览 7498 08-05

随着日本3-0,韩国4-2,U23亚洲杯最新形势:2支6分队未提前晋级

侃球熊弟 浏览 200 01-11

奥迪A6/Q6 e-tron海外推“车载游戏机”模式,可多人同玩

IT之家 浏览 6143 08-07

国产双发直升机首次完成高原自转着陆试飞

环球网资讯 浏览 9597 06-22

对黄奕的抵制本质是一场大型厌蠢

江湖人称艾掌门 浏览 393 08-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11