关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029884人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

热那亚女足新援引爆网络,球迷盛赞:现役最美、足坛最性感球员

直播吧 浏览 8753 07-25

中国车企全球突围:比亚迪前四月海外销量增长110%

新汽车志 浏览 643 05-20

切尔西赢麻了!赚1.14亿刀 连拿新老世俱杯冠军+成唯一超级满贯队

我爱英超 浏览 6347 07-14

我真的服了汪顺!老天爷到底给他关过哪扇窗啊?

小光侃娱乐 浏览 309 11-25

一架香港飞往新德里空客A321客机着陆后起火

纵相新闻 浏览 3145 07-25

"北溪"管道爆炸案7名嫌犯身份披露:均为乌克兰公民

红星新闻 浏览 568 08-29

一架可与核潜艇通信的美军机在格陵兰岛附近"异常"飞行

环球网资讯 浏览 521 08-24

女子毕业24年后起诉母校多收4000元学费 要求退一赔十

大风新闻 浏览 357 12-12

72岁老人信访遭干部辱骂“老不死” 当地政府回应

极目新闻 浏览 605 08-25

星巴克中国出售,瑞幸大股东也盯上了!

餐饮老板内参 浏览 2561 07-13

一周AI大事:马斯克虚拟女友爆火 黄仁勋见谁夸谁

网易科技报道 浏览 9119 07-21

Here we go!罗马诺:佛罗伦萨边锋布雷卡洛将加盟奥维耶多

懂球帝 浏览 546 08-21

青海刻石被证实为秦代遗物 37个字与秦始皇有关

第一财经资讯 浏览 495 09-16

留学,出现新变化!

国是直通车 浏览 459 09-01

双十一购物不烧脑!看AI全能搭子荣耀Magic8如何重塑消费体验

新熵 浏览 373 10-25

比亚迪“松绑”方程豹

汽车公社 浏览 365 09-11

小扎千亿新模型被曝「套壳」Qwen!Meta开源已成笑话

新智元 浏览 290 12-11

探营2025外滩大会:机器人“炫技”,未来生活啥模样?

中国基金报 浏览 504 09-11

2026款ICON巧克力上市 限时心动价7.98-8.58万

网易汽车 浏览 4265 07-13

广东一学校收班费 家长质疑:每人收200 一学期花1万吗

极目新闻 浏览 534 09-15

不降息!美联储再度无视特朗普威胁,但内部已现分歧……

国际金融报 浏览 9512 07-31
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11