关闭广告

多模态大模型学会回头「看」：中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029212人阅读

尽管多模态大模型在数学、科学等结构化任务中取得了长足进步，但在需要灵活解读视觉信息的通用场景下，其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式，却缺乏对视觉线索的深度校验与再思考能力，导致在复杂场景下频繁出错。

为解决这一难题，来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker，一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思（Cue-Guided Rethinking）」模式，它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程，GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型，并在多个数学及知识推理榜单上展现出 SOTA 性能，证明了该方法的有效性和泛化能力。目前，论文、数据及模型均已开源。

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

猜你喜欢

相关阅读

纯电大六座SUV理想i8预售35-40万 7月29日上市

网易汽车浏览 245 07-17

印学者：印度不是真想对抗中国演给美国看的

澎湃新闻浏览 4595 07-18

俄乌冲突以来首次乌克兰多地爆发大规模反政府抗议

红星新闻浏览 8777 07-24

精彩推荐

Mistral首个开源语音模型来了！全面碾压Whisper，多项测试超越GPT-4o mini

智东西浏览 1861 07-17

Counterpoint：2025Q2 全球智能手机出货量三星、苹果、小米前三

IT之家浏览 2036 07-17

太惨了！41岁演员于清斌沦落送外卖，房贷月供一万，为生存低头

娱乐白名单浏览 5517 07-08

中国人寿清仓这家银行，银行股短期见顶？

网易财经浏览 1079 07-17

CNN：特朗普对动用美军打击伊朗越来越热情

澎湃新闻浏览 3183 06-19

上半年销量最高增幅达16%！主流合资品牌起势回暖

每日经济新闻浏览 4365 07-06

温州鞋王急抛百亿疫苗帝国

网易财经浏览 1304 07-18

女孩患重病每天工作20个小时曾10天收5份病危通知书

红星新闻浏览 3648 07-21

在美国卖酱香饼的中国小伙开直播：花了3万美金已保释

都市现场浏览 1254 07-21

黄奕女儿，一句话戳穿黄奕的真实处境，她给所有星二代提了醒

温柔娱公子浏览 135 07-24

媒体：国际贸易格局变了美国影响力正在逐渐减弱

极目新闻浏览 3899 07-14

＂创世遗迹＂捕捉者：中国科学家在5250米海拔寻宇宙起源密码｜封面头条

封面新闻浏览 2866 07-17

利空突袭！深夜，大跌！

券商中国浏览 7656 07-12

北大-灵初发布具身VLA全面综述！一文看清VLA技术路线与未来趋势

机器之心Pro 浏览 7483 07-25

青海省厅长、州委书记、州长等136人被追责问责

界面新闻浏览 2404 06-17

新增长极！半年破2万亿

国是直通车浏览 2990 07-26

春节档后的票房冠军，居然是她

独立鱼浏览 7013 07-14

驻伊朗使馆提醒在伊中国公民尽快回国

环球网资讯浏览 8819 06-18

演唱会＂出轨门＂女HR未被辞退新CEO:公司现在家喻户晓

红星新闻浏览 870 07-23

智能机器人“灵犀”现身绿色算力大会行业成果发布

环球网资讯浏览 497 07-13

周先旺被查疫情时曾面对央视镜头提到＂革职以谢天下＂

界面新闻浏览 4645 07-09

本站所有信息收集于互联网，如本站收集信息侵权，请联系我们及时删除
沪ICP备20017958号-11