关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029880人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美以袭击伊朗 中东军事冲突持续升级

国际在线 浏览 223 03-02

暴涨超155%!养猪巨头新希望,净赚超6.8亿

侃见财经 浏览 3463 07-16

日本男篮39分大胜关岛锁定B组前2 确定不会和中国男篮1/4决赛遭遇

直播吧 浏览 9998 08-11

意天空:德布劳内至少伤缺3-4个月,需决定手术还是保守治疗

懂球帝 浏览 347 10-28

欧洲外交官警告俄方:北约准备好击落侵犯领空俄飞机

环球网资讯 浏览 494 09-26

限时一口价16.99万起 2026款别克昂科威Plus上市

网易汽车 浏览 458 09-11

会打扮的五六十岁女人:裙子过膝盖,衣服不紧衣,时髦还优雅

静儿时尚达人 浏览 1709 07-16

负债35亿元!扫地机器人巨头宣布破产,被中国代工厂收购;麦当劳回应涨价,网友:谁允许了;我国首批L3级自动驾驶车型进入准入目录

雷峰网 浏览 271 12-16

媒体:泰柬边境重燃战火 在泰国产生了巨大的政治影响

红星新闻 浏览 3188 07-25

高通骁龙8 Elite 2跑分出炉:飙到4.74GHz 史无前例

快科技 浏览 572 08-12

乌军袭击一生产弹道导弹的俄军工厂

每日经济新闻 浏览 268 02-23

男子强奸大嫂出狱再杀人案启动再审 高院披露详情

南国今报 浏览 372 10-29

我把AI当辅助,AI删我数据库

量子位 浏览 4788 07-24

田栩宁梓渝酒店开房?柯淳惨卖!

八卦疯叔 浏览 6321 07-27

87家央企"一把手"薪酬信息披露:年薪90万元以上19人

大风新闻 浏览 278 01-21

国企董事长上门殴打他人被行拘3天 本人拒绝回应

大风新闻 浏览 264 01-27

大号手机确认!华为MatePad Mini外观揭晓 能打电话的小平板来了

快科技 浏览 481 09-01

破纪录了!纯电续航跑了1205公里!量产车!

小李车评李建红 浏览 1011 07-12

原来做自媒体的“成功心法”都是同一个

黎贝卡的异想世界 浏览 353 10-29

马刺加时134-130爵士取季前赛3连胜,文班22+7,贝利20+7

懂球帝 浏览 367 10-11

万科再“瘦身”:消失的区域公司

YOUNG财经 浏览 7291 07-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11