关闭广告

武汉大学让AI学会诊断金融知识:像医生检查身体一样评估AI模型

科技行者2025-09-10 00:00:02210人阅读


这项由武汉大学人工智能学院的谢倩倩教授领导的研究团队在2025年8月发表,论文题为《From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models》,该研究首次将教育心理学中的认知诊断理论引入到金融AI评估领域。有兴趣深入了解的读者可以通过GitHub项目页面https://github.com/WHUNextGen/FinCDM访问完整研究成果。

当我们去医院体检时,医生不会只告诉你"身体状况70分"就完事,而是会详细检查你的心脏、肝脏、肺部各个器官的具体情况,告诉你哪里健康、哪里需要注意。但令人意外的是,在评估金融AI模型时,我们却一直在用那种简单粗暴的"总分"方式。

考虑这样一个场景:两个学生都考了80分,但一个是因为数学好语文差,另一个是语文好数学差。如果只看总分,我们永远不知道该给他们推荐什么样的补习班。武汉大学的研究团队发现,评估金融AI模型时也存在完全相同的问题。目前所有的评估方法都只给出一个总体得分,比如"在金融问答任务上准确率85%",但这个分数完全无法

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

男子应聘船员出海严重晕船自缢:一吃就吐 甚至用头撞墙

极目新闻 浏览 107 10-17

郑州公交集团回应"白天载客晚上拉货":图假事确实要做

每日经济新闻 浏览 10304 07-22

足球报:国安只是暂时度过危机,现在算计积分排名没有太多意义

直播吧 浏览 253 08-26

10亿天价挖角惨遭12人连环拒,小扎钞能力失灵!OpenAI系初创0人卖身

新智元 浏览 5467 07-30

离婚4年,42岁佟丽娅高调官宣喜讯

刘森森 浏览 67 11-01

这种水果好处大大的

科普中国 浏览 9395 09-27

诺贝尔文学奖得主迷恋中国 要求全家改用筷子吃饭

中国新闻周刊 浏览 107 10-11

《生万物》“丑娘”迟蓬 用高演技打败一众医美脸

梦录的西方史话 浏览 266 08-23

开拓者队记点评杨瀚森:20岁就会指挥交通了 非常好的信号!

直播吧 浏览 3139 07-12

未来五年什么样?速来查阅“十五五”规划建议,蓝图清晰!

国是直通车 浏览 78 10-29

成都多小区同时停电有人被困电梯40分钟 附近酒店爆满

封面新闻 浏览 1519 07-19

U22国足新一期名单有8人入选过成年国家队,6人有过出场经历

懂球帝 浏览 245 08-23

同一天3架波音新飞机飞往中国 媒体:非常罕见

每日经济新闻 浏览 2514 07-17

女子家里恶臭弥漫一打开门全是粪 看完监控崩溃

极目新闻 浏览 234 09-07

许传智被查:在中纪委工作超30年 曾任宁夏纪委书记

界面新闻 浏览 115 10-15

杀完鸡,特朗普向外企撂话:雇佣、培训美国工人

观察者网 浏览 199 09-09

90后宝妈网购猪食槽收纳孩子玩具走红 商家:订单超6倍

极目新闻 浏览 89 10-26

反杀?日系SUV卖的比国产SUV还便宜!

少数派报告Report 浏览 8285 07-05

悼念若塔兄弟,B费、达洛特、阿莫林来到安菲尔德献花

懂球帝 浏览 2790 07-15

发现新疆戈壁"为人民服务"标语遭破坏 博主决定去修复

极目新闻 浏览 118 10-15

雀巢大中华区业绩“跌跌不休”,新帅马凯思能否“救火”?

国际金融报 浏览 4051 07-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11