关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029212人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

Mistral首个开源语音模型来了!全面碾压Whisper,多项测试超越GPT-4o mini

智东西 浏览 1861 07-17

Counterpoint:2025Q2 全球智能手机出货量三星、苹果、小米前三

IT之家 浏览 2036 07-17

太惨了!41岁演员于清斌沦落送外卖,房贷月供一万,为生存低头

娱乐白名单 浏览 5517 07-08

中国人寿清仓这家银行,银行股短期见顶?

网易财经 浏览 1079 07-17

CNN:特朗普对动用美军打击伊朗越来越热情

澎湃新闻 浏览 3183 06-19

上半年销量最高增幅达16%!主流合资品牌起势回暖

每日经济新闻 浏览 4365 07-06

温州鞋王急抛百亿疫苗帝国

网易财经 浏览 1304 07-18

女孩患重病每天工作20个小时 曾10天收5份病危通知书

红星新闻 浏览 3648 07-21

在美国卖酱香饼的中国小伙开直播:花了3万美金已保释

都市现场 浏览 1254 07-21

黄奕女儿,一句话戳穿黄奕的真实处境,她给所有星二代提了醒

温柔娱公子 浏览 135 07-24

媒体:国际贸易格局变了 美国影响力正在逐渐减弱

极目新闻 浏览 3899 07-14

"创世遗迹"捕捉者:中国科学家在5250米海拔寻宇宙起源密码|封面头条

封面新闻 浏览 2866 07-17

利空突袭!深夜,大跌!

券商中国 浏览 7656 07-12

北大-灵初发布具身VLA全面综述!一文看清VLA技术路线与未来趋势

机器之心Pro 浏览 7483 07-25

青海省厅长、州委书记、州长等136人被追责问责

界面新闻 浏览 2404 06-17

新增长极!半年破2万亿

国是直通车 浏览 2990 07-26

春节档后的票房冠军,居然是她

独立鱼 浏览 7013 07-14

驻伊朗使馆提醒在伊中国公民尽快回国

环球网资讯 浏览 8819 06-18

演唱会"出轨门"女HR未被辞退 新CEO:公司现在家喻户晓

红星新闻 浏览 870 07-23

智能机器人“灵犀”现身绿色算力大会 行业成果发布

环球网资讯 浏览 497 07-13

周先旺被查 疫情时曾面对央视镜头提到"革职以谢天下"

界面新闻 浏览 4645 07-09
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11