关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029879人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

2026春夏八大流行趋势,早穿早美!

Yuki女人故事 浏览 293 02-04

烈马电动化首战,福特如何用经典IP破局新能源红海?

车云网 浏览 943 07-17

公开喊话 贾跃亭称FF愿与特斯拉展开合作

车质网 浏览 280 11-27

杨瀚森不参加与委内瑞拉两场热身赛 月底打波黑两场也大概率不打

醉卧浮生 浏览 3961 07-24

200亿家居龙头,创始人遗孀走到台前

21财闻汇 浏览 439 09-11

车企竞逐六座SUV蛋糕

证券市场周刊 浏览 608 08-20

以军对加沙地带南部的哈马斯目标发动袭击

新华社 浏览 277 10-21

九三阅兵具体安排来了

央视新闻客户端 浏览 449 09-02

同是嫁富豪 把王艳刘涛和李湘一对比差距就出来了

阿乣评论哥 浏览 474 08-26

微软宣布全球裁员6000人 为2023年以来最大规模

界面新闻 浏览 763 05-14

首条苏州⇋上海市中心航线试飞成功

上观新闻 浏览 3186 07-21

李想:造车新势力中 只有我和雷军能打造超级产品

红星新闻 浏览 623 08-20

牛弹琴:中美领导人通话谈台湾问题 特朗普比较清醒

北京日报客户端 浏览 345 11-25

美军2架F-18战机飞入委内瑞拉领空 停留至少40分钟

界面新闻 浏览 241 12-11

2025款红旗H6正式上市 售价17.98-23.98万元

车质网 浏览 6408 06-28

56岁陈红颜值回春,参加路演不惧高清镜头,她满脸皱纹依旧美丽

温柔娱公子 浏览 385 10-12

宁波诺丁汉大学"44万学费的录取通知书"火了

极目新闻 浏览 27848 08-08

三年回撤小于20%的基金经理,只有这么几位了

炒基蛋 浏览 9332 08-07

参议院选举遭历史性惨败 自民党麻生派要求石破茂下台

国际在线 浏览 7877 07-21

上海女生第三次摇号成功抢到1200万元房子:心有余悸

每日经济新闻 浏览 9522 07-09

田栩宁事件影响恶劣!受害者丢工作,湖南台被牵连,网友要求封杀

萌神木木 浏览 7562 07-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11