关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029803人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

女网红被"开盒"收大量骚扰信息全家被迫搬离 本人发声

环球网资讯 浏览 473 09-22

2025光伏半年会侧记:反内卷尚未成功,仍须加倍努力!

赶碳号 浏览 5252 07-26

90岁钟南山院士佩戴"共和国勋章"观礼阅兵

极目新闻 浏览 361 09-03

活塞GM:我们非常欣赏霍兰的竞争天性和职业道德 他渴望做到最佳

直播吧 浏览 8747 07-14

美国怎么就被中国稀土卡了脖子?原因你肯定想不到

观察者网 浏览 6516 07-12

南京银行谢宁:央行老兵的数字金融哲学

阿尔法工场 浏览 1130 07-17

越南经历"最彻底一次变革" 地方政府已裁员2万人

中国新闻周刊 浏览 7231 07-11

娃哈哈精密机械公司启动解散清算,员工称已收到终止劳动合同通知

红星资本局 浏览 125 03-03

海廷加:奥斯梅恩和伊布、德罗巴一样强大,始终是一个威胁

懂球帝 浏览 271 11-05

夏天衣服没有必要买太多,试试“一衣多穿”,实用耐看又舒适

静儿时尚达人 浏览 331 08-28

美日贸易协议分歧持续,美国计划现有关税基础上加征15%关税

华尔街见闻官方 浏览 7574 08-07

高盛最新研报:AI是基础设施革命,等同于铁路、电气化、互联网

财通社 浏览 282 10-02

海南悬赏10万搜寻无人机:丢失2个多月 目前尚未找到

极目新闻 浏览 296 09-18

罗志恒:全球关税——起源、演进历程及对财政的贡献

首席经济学家论坛 浏览 494 08-12

济南时报:韩国主帅表决心定要击败中国队 明晚男篮将帅切莫大意

直播吧 浏览 1610 08-13

撒贝宁去加拿大探望丈人,带着老婆孩子逛街

甜柠聊史 浏览 316 10-17

今年秋天一定要拥有的10件单品,时髦又高级!

LinkFashion 浏览 226 10-07

某球队消息人士谈库明加吉迪互换东家流言:扯淡

直播吧 浏览 4659 08-12

汉莎航空CEO夫人被指在意度假区撞死路人 已回到德国

红星新闻 浏览 1016 07-14

姜武:放心,天堂不会再有日本人了!

小娱乐悠悠 浏览 339 09-18

7岁男孩哭诉被冤枉跳楼坠亡 物业及3个孩子被判赔60万

红星新闻 浏览 10361 08-05
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11