关闭广告

武汉大学让AI学会诊断金融知识:像医生检查身体一样评估AI模型

科技行者2025-09-10 00:00:02370人阅读


这项由武汉大学人工智能学院的谢倩倩教授领导的研究团队在2025年8月发表,论文题为《From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models》,该研究首次将教育心理学中的认知诊断理论引入到金融AI评估领域。有兴趣深入了解的读者可以通过GitHub项目页面https://github.com/WHUNextGen/FinCDM访问完整研究成果。

当我们去医院体检时,医生不会只告诉你"身体状况70分"就完事,而是会详细检查你的心脏、肝脏、肺部各个器官的具体情况,告诉你哪里健康、哪里需要注意。但令人意外的是,在评估金融AI模型时,我们却一直在用那种简单粗暴的"总分"方式。

考虑这样一个场景:两个学生都考了80分,但一个是因为数学好语文差,另一个是语文好数学差。如果只看总分,我们永远不知道该给他们推荐什么样的补习班。武汉大学的研究团队发现,评估金融AI模型时也存在完全相同的问题。目前所有的评估方法都只给出一个总体得分,比如"在金融问答任务上准确率85%",但这个分数完全无法

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

图片报:多特改造厨房花费1100万欧,类似原因使今夏转会预算有限

直播吧 浏览 1274 08-06

泽连斯基明确拒绝普京72小时停火提议

CCTV国际时讯 浏览 6085 05-04

率先挺进决赛!张本智和4-1贾哈 将战王楚钦与莫雷加德的胜者

直播吧 浏览 393 08-11

宁德时代重要矿山停产 有投资者光着膀子深夜上山蹲守

每日经济新闻 浏览 525 08-12

指腹为婚?姜文女儿法国出嫁,面部浮肿一脸孕相

清游说娱 浏览 449 08-11

李斌说蔚来“钱都亏在了明处”,这些“明处”都是哪儿?

锦缎研究院 浏览 2416 07-17

湿疹是“太湿”引起的,要保持干燥?

网易健康 浏览 458 08-15

英特尔转型:裁员15%,聚焦AI芯片市场

国际金融报 浏览 9333 07-26

财经早餐:国内金饰1克已高达1235元;人民币对美元汇率中间价报7.0995

网易财经 浏览 270 10-16

独家|字节视觉大模型负责人杨建朝今日内部官宣休息 周畅接任

态℃ 浏览 3953 07-18

徐正源:以饱满斗志迎接挑战 会对阵容进行调整

体坛周报 浏览 245 10-21

美方指控2名中国人出口限制芯片 中方回应

环球网资讯 浏览 9885 08-08

一张照片+一段音频生成“电影大片”视频!通义万相又一重磅开源

智东西 浏览 368 08-28

美驱逐舰驶近伊朗海域 伊朗直升机驱逐遭警告

看看新闻Knews 浏览 7026 07-24

对手注意到你了!杨瀚森首节4投2中得到4分1板1助 也有2失误2犯规

直播吧 浏览 2785 07-13

2025浦江创新论坛主论坛举行,汇聚全球智慧力量,构建开放合作科技共同体

澎湃新闻 浏览 353 09-22

亲善大使!大加转发阿贾当选MVP内容:4xMVP 继续创造历史吧!

直播吧 浏览 239 09-22

特朗普"看中"李在明的签字笔:要带回去吗 我很喜欢

上观新闻 浏览 501 08-27

中国航空工业集团有限公司原党组书记谭瑞松被公诉

央视新闻客户端 浏览 966 08-06

"折叠男孩"已能躺平将回校园:趴着高考 身体被敲断4次

大风新闻 浏览 480 08-26

特朗普政府再借美联储总部翻修“攻击”:白宫指鲍威尔“严重管理不善”

华尔街见闻官方 浏览 2592 07-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11