关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029614人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

G联盟MVP戴维森和火箭签的1年双向合同 这是其可签双向的最后一季

直播吧 浏览 7833 07-27

西足协主席谈亚马尔:本应处理得更好,重要的是照顾好球员

懂球帝 浏览 36 11-12

招商银行高管来源悄然生变,四大分行行长再进阶

财经众议院 浏览 205 09-10

纽约华人女子因“花园太丑” 收到2000美元罚款通知

红星新闻 浏览 7915 07-29

阿萨德垮台,谁将掌权叙利亚?

浏览 8068 07-14

韩鹏:年轻球员的更新换代势在必行,还得保护他们的自信心

直播吧 浏览 277 08-22

中美会谈结束 中方公布的成果里有两件事让人没想到

博览历史 浏览 237 09-17

游泳世锦赛女子100米蛙泳:唐钱婷第七、杨畅第十,晋级半决赛

直播吧 浏览 9174 07-28

看来看去还是这些穿搭舒适!深浅互补、多穿阔腿裤,简约自然

静儿时尚达人 浏览 108 10-14

赖清德宣布追加400亿美元用于对美军购 提及2个时间点

经济观察报 浏览 157 11-27

皇马FC26评分:姆巴佩91、巴尔韦德89、阿诺德86、赫伊森82

懂球帝 浏览 234 08-29

马斯克开杠"大而美"法案 美众议长:特朗普对他不满

环球网资讯 浏览 8831 06-06

俄罗斯海军完成“七月风暴”作战演习

浏览 153575 09-26

没能收回被俄罗斯扣留的3架飞机,山河智能收到1.6亿保险赔款

正经社 浏览 1851 08-13

汪苏泷疑似恋情曝光,被扒是62万粉丝的女网红

老吴教育课堂 浏览 166 09-26

今日热点:欧豪一整天都在央视;许荔莎22年因赵晴被拍和许凯分手……

伊周潮流 浏览 247 08-23

“高德扫街榜” 背后的商业逻辑是什么?丨商业快评

封面新闻 浏览 197 09-10

气坏瑜美人!王欣瑜赛中屡遭争议判罚,赛后拒绝与主裁判握手

直播吧 浏览 1356 07-24

7月最值得看的绝美展览,在广州的小伙伴不要错过跟儿力力面基

黎贝卡的异想世界 浏览 9350 07-09

胡一天时隔两年接到新戏了!杀回现偶赛道演学霸

鲁中晨报 浏览 3829 07-11

邮报:拉亚已成为世界最优秀的门将之一,扑救与脚下技术俱佳

懂球帝 浏览 102 10-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11