关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029259人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

宁波银行业绩快报:上半年净利润147.72亿 同比增8.23%

网易财经 浏览 9889 07-25

快讯|国内首个垂类妇科大模型通过主任医师考试

网易科技报道 浏览 7256 07-30

以伊冲突后 哈梅内伊首次公开露面

央视新闻客户端 浏览 6834 07-07

伊恩-拉什:萨拉赫100%应该成为利物浦副队长

直播吧 浏览 9976 07-26

理想汽车首款纯电SUV理想i8发布 零售价32.18万到36.98万

雷递 浏览 9220 07-30

股民疯抢中国“银伟达”

吴晓波频道 浏览 8773 07-12

270余人遇难 印度航空空难初步调查报告公布

界面新闻 浏览 10092 07-12

万业企业成立热电科技公司 含半导体相关业务

证券时报 浏览 4482 07-31

最高涨逾35%,银行股狂欢!公募潜在配置空间巨大

券商中国 浏览 9447 07-11

最适合早秋的3种风格,又美又飒!

Yuki女人故事 浏览 9646 07-29

千亿公募换帅!能否打破“债强股弱”局面?

国际金融报 浏览 2378 07-17

杨瀚森回应开拓者首秀:若满分是100分 给自己打60分

新京报 浏览 2329 07-13

特朗普政府再借美联储总部翻修“攻击”:白宫指鲍威尔“严重管理不善”

华尔街见闻官方 浏览 2066 07-11

荣耀亲选“无线耳机鼠标二合一”新品曝光,8 月上市

IT之家 浏览 1636 07-31

泰柬冲突致多人死伤 双方争议地区疑含有大量稀土资源

上观新闻 浏览 7138 07-26

伊朗称已做好适当打击以色列的充分准备

界面新闻 浏览 589 05-27

汪小菲带子女回内地见张兰,小S全家出游独留S妈伤感,差距太大!

萌神木木 浏览 1675 07-15

他信首次公开回应:洪森给我女儿"下套""兄弟情"已破裂

观察者网 浏览 7165 07-11

299元让汪峰教我唱歌?跨界卖课成了明星的新副业方向

互联网那些事 浏览 596 07-24

柬埔寨击落泰国F-16战机 网传说法从何而来

澎湃新闻 浏览 1370 07-29

漂亮饭“围攻”江浙沪

餐饮老板内参 浏览 5963 07-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11