关闭广告

武汉大学让AI学会诊断金融知识:像医生检查身体一样评估AI模型

科技行者2025-09-10 00:00:02441人阅读


这项由武汉大学人工智能学院的谢倩倩教授领导的研究团队在2025年8月发表,论文题为《From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models》,该研究首次将教育心理学中的认知诊断理论引入到金融AI评估领域。有兴趣深入了解的读者可以通过GitHub项目页面https://github.com/WHUNextGen/FinCDM访问完整研究成果。

当我们去医院体检时,医生不会只告诉你"身体状况70分"就完事,而是会详细检查你的心脏、肝脏、肺部各个器官的具体情况,告诉你哪里健康、哪里需要注意。但令人意外的是,在评估金融AI模型时,我们却一直在用那种简单粗暴的"总分"方式。

考虑这样一个场景:两个学生都考了80分,但一个是因为数学好语文差,另一个是语文好数学差。如果只看总分,我们永远不知道该给他们推荐什么样的补习班。武汉大学的研究团队发现,评估金融AI模型时也存在完全相同的问题。目前所有的评估方法都只给出一个总体得分,比如"在金融问答任务上准确率85%",但这个分数完全无法

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

热议中超:恶心国安放水,西海岸和英博值得尊重

懂球帝 浏览 339 10-27

猫眼娱乐:预计上半年公司拥有人应占溢利同比降低约29.8%至43.8%

览富财经网 浏览 563 08-11

董璇自曝二婚!刚领证男方身份被扒

娱乐看阿敞 浏览 4980 07-16

美军无人装备计划受挫 曾称要让台湾海峡变"地狱景观"

环球网资讯 浏览 543 09-29

物资极端短缺 加沙人被迫步行5公里买几张饼

北青网-北京青年报 浏览 347 10-25

大爷拍"素颜巴黎"火了:欧洲行费用1万多 不会说英语

极目新闻 浏览 287 01-09

官方点赞️NBA官推:开拓者新秀杨瀚森的脚步太棒了

直播吧 浏览 10281 07-13

有点肉肉的女生,夏天这么穿巨好看!巨显瘦!

Yuki女人故事 浏览 5412 06-12

从问界M8到坦克500,这六款国产“黑马”车型,到底做对了什么?

车域无疆 浏览 462 09-01

多地布局、资本热捧,具身智能发展到哪儿了?

国是直通车 浏览 5843 08-11

《西游记》「如来佛祖」北京病逝 六小龄童悼念!

ETtoday星光云 浏览 3880 08-04

中秋看热巴的嫦娥装,又双叒叕被撩到了

时尚COSMO 浏览 347 10-07

68岁倪萍发近万字长文

老吴教育课堂 浏览 487 08-28

惨!武术冠军自掏腰包拍武侠片,成本超1500万,4天票房仅169万

靠谱电影君 浏览 370 10-22

HMD Pulse 2 Pro手机跑分曝光:紫光展锐T7250芯片、4GB内存

IT之家 浏览 277 12-16

乐道汽车:L90 配备来自蔚来十年技术累积的 4D 舒适领航功能

IT之家 浏览 2612 07-13

闪购让淘宝和拼多多活跃度拉开距离,便宜外卖仍将持续

晚点LatePost 浏览 468 08-27

斯塔默将访华:不学卡尼 中英关系不会激怒特朗普

澎湃新闻 浏览 273 01-28

美团召开外卖行业恳谈会

第一财经资讯 浏览 7773 07-25

限制赎回风波后,当红PE Blue Owl为数据中心专项基金募资17亿美元

华尔街见闻官方 浏览 294 12-05

伊朗并未请求延长停火 伊高官:必须武力回应封锁

财联社 浏览 179 04-22
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11