关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029799人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

北大被指联系"韦神"家属望注销其账号

环球网资讯 浏览 3666 06-10

中国大规模减持美债!央行已连续10个月买入黄金 专家:黄金可对冲美元风险

每日经济新闻 浏览 338 09-21

天空体育记者:维拉不会在转会截止日带来惊喜

懂球帝 浏览 174 02-03

13.99万元起 深度解读深蓝L06三大黑科技

第五冲程 浏览 281 11-02

前罗马门将的15岁儿子因病去世,罗马全队举横幅表示慰问和哀悼

直播吧 浏览 9039 07-30

张译李光洁喝酒聚餐,两人吃小馆被赞朴素接地气

喵姐爱娱乐8 浏览 4491 08-04

2架美军机在南海相继坠毁 原因正在调查中

界面新闻 浏览 259 10-27

宋小宝春晚临时瞎编一句话红遍全国

乡野小珥 浏览 221 11-03

“气球裤”今年夏天火爆了,这样穿时髦松弛又减龄

LinkFashion 浏览 2248 07-15

城镇化率突破67%,城市发展转向存量优化,自然资源部:将发布规划指南

时代周报 浏览 344 09-22

剪发总翻车?30秒测额头类型!对应刘海公式 + 化妆技巧全拿捏

Yuki女人故事 浏览 4802 08-13

国足出战FIFA系列赛!媒体人热议:托国际足联福,别一直闭门造车

奥拜尔 浏览 188 01-20

凌晨,Qwen又更新了,3090就能跑,3B激活媲美GPT-4o

机器之心Pro 浏览 3809 07-30

贾健旭力压余承东,BBA 又疯狂躺枪了

autocarweekly 浏览 325 09-25

特斯拉官宣,这款车售价下调至25.95万元!

每日经济新闻 浏览 426 09-01

迪马:如果签不下卢克曼,国米备选方案是冈萨雷斯、桑乔和恩昆库

直播吧 浏览 1421 07-17

Hinton上海对话周伯文:多模态聊天机器人已经具有意识

量子位 浏览 3770 07-27

太阳报:奥纳纳在赛后离场时推搡球迷,是出于对自身安全的考虑

直播吧 浏览 346 09-11

332亿,清华富二代要IPO

财通社 浏览 353 09-11

王力宏伴舞机器人高难度后空翻后稳稳落地,马斯克点赞!

大象新闻 浏览 191 12-21

“老仓鼠”基金经理,坑了基民3900万管理费

深蓝财经 浏览 395 08-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11