关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029796人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

王毅谈及泰柬边境争端 泰国外长:感谢中方

环球网 浏览 5388 07-12

停车系餐饮,正在席卷餐饮市场

快刀财经 浏览 6777 07-27

随着国足0-2日本,韩国2-0中国香港,东亚杯积分榜:中国队仍第3

侃球熊弟 浏览 5441 07-13

这么丑的五指鞋,会是OOTD新风向吗?

时尚COSMO 浏览 3991 07-19

许凯成吴签2.0!组局醉酒强吻女生,事后交往玩腻后冷暴力分手

萌神木木 浏览 355 08-23

莫迪一步不让美印彻底翻脸 印"深远一击"美元霸权告急

博览历史 浏览 3575 08-13

市值26亿豪掷32亿跨界“钠电”,环保企业“同兴科技”胜算几何?

时代周报 浏览 197 12-12

微软 Copilot 官方形象上线,AI 聊天更生动

IT之家 浏览 791 07-26

国产GPU厂商燧原科技科创板IPO获受理 拟融资60亿

网易财经 浏览 190 01-23

大湾区晚会收视出炉!小沈阳父女拿下最高点,王源和时团联手赶客

萌神木木 浏览 328 09-29

2025年暑期,旅游业没有旺季

虎嗅APP 浏览 5861 07-22

前有携程、美团,后有京东、淘宝,抖音再攻酒旅市场图什么?

时代周报 浏览 9369 08-11

九三阅兵最后一次夜间演练画面公开

央视新闻客户端 浏览 20531 08-25

57岁中国农场主在赞比亚遇害 嫌犯溺亡尸体浮出水面

红星新闻 浏览 1067 08-09

从头部驱动到生态共建,初瑞雪重构直播团队新范式

时代周报 浏览 193 12-12

舒淇哽咽表白冯德伦:谢谢你娶一个不常在家的女人

Yuki女人故事 浏览 330 09-29

被特朗普要求改配方的可口可乐,二季度业绩大涨

国际金融报 浏览 7255 07-25

零跑业绩向好 朱江明持股增加

汽势传媒 浏览 249 10-21

特朗普一天搞出三件事 涉及可乐、高铁和150余国

新民周刊 浏览 4060 07-18

狼队主帅:我执教的6场比赛,踢到后面球队总是会自己崩盘

懂球帝 浏览 194 12-21

曼谷联主帅:中国每支球队水平都很高,我们已详细分析成都队

懂球帝 浏览 5580 08-12
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11