关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029883人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

女子商场遭挟持被捅20余刀靠隆胸假体活命 警方通报

鲁中晨报 浏览 3520 06-15

连爆2大行业瓜!大花回应只字不提影帝

大龄女一晓彤 浏览 288 11-10

北向资金二季度持仓出炉!多只金融、算力、光伏概念股被重仓!

私募排排网 浏览 3348 07-12

英国防大臣称想"绑架"普京 俄方:痴人说梦

界面新闻 浏览 296 01-13

阿维塔直播实测0.21Cd!续航生死战:新能源车为何死磕0.01风阻?

车域无疆 浏览 518 05-12

李连杰因甲亢住院,病床照曝光表情痛苦,好友晒聊天记录报平安

扒虾侃娱 浏览 487 08-18

MSC咨询合伙人金霞:可持续发展+AI,重构商业增长范式

南方都市报 浏览 334 11-01

俄总统助理:普京和特朗普会晤意愿依旧存在

每日经济新闻 浏览 329 10-29

美国施压澳大利亚增加军费 中国驻澳大使撰文提醒

环球网资讯 浏览 2890 07-01

记者:阿森纳将接触水晶宫,希望了解是否能不触发解约金签埃泽

直播吧 浏览 1938 07-15

美元走弱对亚洲市场意味着什么?经济学家:警惕“非常态”贬值的市场剧震

第一财经资讯 浏览 278 01-23

阅兵观礼名单公布 媒体:李在明错失与金正恩会面机会

看看新闻Knews 浏览 436 08-30

上市半月订单破3万 大六座SUV领克900售28.99万起

网易汽车 浏览 538 05-17

睡眠电子耳塞可以助眠吗

网易健康 浏览 3800 02-26

深圳机场将再添一座航站楼 年旅客吞吐量3100万人次

新京报 浏览 430 08-24

第三代UNI-V正式上市 指导价10.29-11.99万元

网易汽车 浏览 2342 08-09

趋势!考核升级,全国多地探索从严管理新机制

识局 浏览 339 10-28

MIT所长涉嫌图片操纵,《自然》发布关注声明

知识分子 浏览 411 09-29

18岁留学女孩被实时监控 按"指令"回国装满一箱钱送走

极目新闻 浏览 494 09-21

电讯报:埃基蒂克是伊萨克之外的最优选 利物浦还需一名新边锋

直播吧 浏览 2528 08-12

奥特曼零食之父,要去IPO了

投资家 浏览 312 10-28
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11