关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029802人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

高市早苗当选首相 日本史上首名"第一先生"信息披露

环球网资讯 浏览 342 10-22

王化:“雷军谈造车最难的是做轮毂”是断章取义

三言科技 浏览 1580 07-12

狗狗被宠物店放烘干箱一小时活活烤死 门店谎称是中暑

极目新闻 浏览 1901 07-24

今日热点:电影《飞驰人生3》定档春节;大麦否认与黄牛挂钩……

伊周潮流 浏览 161 12-27

北青:国足冒雨进行强度训练;下场大概率主推四后卫阵型

懂球帝 浏览 6164 07-14

《731》拍摄困难重重,背后故事细思极恐,究竟谁在阻挠国内上映

最爱酷影视 浏览 794 07-15

窦骁发文辟谣婚变传闻

柠檬有娱乐 浏览 298 10-24

A股继续走牛有底气

IPO日报 浏览 184 01-09

北青:国足东亚杯末战要进球更要取胜保尊严,球队笃定要攻出去

直播吧 浏览 7447 07-14

券商投行业务排名出炉!中信、中金领先

券商中国 浏览 440 09-01

12岁男孩暴雨中被网约车司机扔半路:还支付了4块钱

封面新闻 浏览 8618 07-04

博主:浙江队30号对阵天津津门虎的比赛将提前至20号进行

直播吧 浏览 3982 08-12

连续夺冠,票房剑指10亿,《长安的荔枝》终于为国产片争了口气!

电和影 浏览 7151 07-24

东部战区战士:已做好真打实打准备

北京日报客户端 浏览 100 12-30

影石 Insta360 影翎 Antigravity 首款全景无人机明晚发布

IT之家 浏览 4716 08-14

王一博羊毛卷火了:自带野性帅气,性张力爆表!网友:清冷贵公子

趣看热点 浏览 2613 07-15

章泽天最新创业,轰动全网!评论区疯狂点名刘强东

财通社 浏览 151 01-13

新款东风雪铁龙天逸C5 AIRCROSS上市14.97万起

网易汽车 浏览 4303 06-23

芝麻开门,中概股逆流潮来了

每日资本论 浏览 485 08-11

ChatGPT 为何退回了 4o ?

虎嗅APP 浏览 486 08-11

聚焦第五届上海知识产权创新奖——中国科学院上海微系统与信息技术研究所成果转化处

上观新闻 浏览 297 10-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11