关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029617人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

MIT和斯坦福打造"超级听力"AI:让机器像人耳一样理解声音的奥秘

科技行者 浏览 239 08-27

卢浮宫盗贼没偷6000万美元钻石 其它被盗藏品或被熔化

极目新闻 浏览 98 10-21

离婚后的孙怡,住80平小屋,吃饭靠点外卖

萱小蕾o 浏览 274 08-17

重启上市路,海明润A股江湖十年再见!深创投加持,剑指北交所!

叩叩财讯 浏览 8098 07-12

官方:维拉22岁前锋刘易斯-多宾租借加盟英冠普雷斯顿

懂球帝 浏览 245 08-23

牛弹琴:总理专机完全避开两国领空 以色列确实也怕了

现代快报 浏览 193 09-26

莱里达竞技官方:邝兆镭将于8月1日到队,并随队一同训练

懂球帝 浏览 2355 07-30

普通人穿衣其实不用太贵,这些基础单品才最实用,百搭又舒适

静儿时尚达人 浏览 9468 06-09

印度IT业协会警告:美国H-1B签证新规将影响整个行业

财联社 浏览 154 09-22

纯电小型SUV还有激光雷达 长安启源Q05预计售11-13万

网易汽车 浏览 2041 08-08

医生+教师“王炸”组合IPO!海圣医疗为千家医院供货年入3亿

野马财经 浏览 56 11-05

中科院发文,50岁是“断崖式衰老”元年

网易科技报道 浏览 9475 07-29

索汉:很遗憾因伤无法代表波兰参加欧锦赛 不会影响新赛季训练营

直播吧 浏览 613 08-11

一箭11星 我国成功发射吉利星座05组卫星

环球网资讯 浏览 199 09-09

光伏企业3季报里的秘密:反内卷之下,行业真的触底反弹了吗?

赶碳号 浏览 56 11-03

又到每年假装自己是汤唯的时候了

时尚COSMO 浏览 132 10-15

于根伟激励全队:付出最大的努力,把最后4轮比赛“咬”下来

懂球帝 浏览 104 10-16

五年磨剑今日出鞘,全新 P7 要带着小鹏再冲一次

爱范儿 浏览 638 08-07

与球队同在!BBC:奥纳纳将缺席季前赛 但会随队赴美&着重康复

直播吧 浏览 7794 07-13

马斯切拉诺:球队正被伤病问题困扰,必须找到伤病的原因

懂球帝 浏览 3799 07-17

足球报:北京市体育局与足协相关领导都会现场观战足协杯决赛

懂球帝 浏览 23 12-02
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11