关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者2025-11-09 00:00:0147人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

财经早餐:现货黄金突破3600美元创历史新高;本月来已近130家公司公告减持

网易财经 浏览 199 09-09

福建一无人岛垃圾泛滥 岛上有140万根玄武岩石柱群

极目新闻 浏览 119 10-13

申花2战不胜!媒体人:别再奢望夺冠,足协自我削弱,亚冠无期待

奥拜尔 浏览 145 10-02

女子出差遭客户强制猥亵致精神创伤:逃卫生间逃过一劫

大风新闻 浏览 78 10-29

Claude更新公告全面禁止中国使用,网友:马上退订、退费;威马汽车已复产,豪言年产百万辆;原vivo品牌副总裁加盟安克创新

雷峰网 浏览 185 09-08

全网最后一批躺赚博主,也被AI挤兑失业了

新周刊 浏览 113 10-13

李迅雷:黄金暴涨、股市波动,普通人机会在哪?

首席经济学家论坛 浏览 111 10-20

未履行2142万案款 罗永浩名下锤子科技成老赖

21世纪经济报道 浏览 157 09-19

“富贵闲人”许绍雄的快乐哲学

仙女事件簿 浏览 68 10-29

19岁小伙错付1010元打车费索要无果后自杀 官方已介入

极目新闻 浏览 2038 07-24

强势母亲装摄像头查岗?黄宗泽谈不婚:10任女友9个半被嫌弃

娱乐白名单 浏览 646 07-15

队记:贝利每天都在接受评估 没完全排除出战剩余夏季联赛的可能

直播吧 浏览 10230 07-14

《爱人5》邓莎率先翻车!后悔嫁富商遭吐槽:图钱就别要情绪价值

萌神木木 浏览 115 10-17

这一轮牛市行情为何“老登股”几乎全线熄火?

郭施亮 浏览 165 09-26

《杨光的快乐生活》女主角,杨少华去世哭花了妆

草莓解说体育 浏览 2832 07-13

解读世纪华通半年报:季度营收九连增,核心增长模式获充分验证

证券市场周刊 浏览 228 09-01

美防长:美国现役海军陆战队正高度戒备

新京报 浏览 8913 06-09

媒体:马克龙将承认巴勒斯坦国英国也发声 这非常难得

新民周刊 浏览 1220 07-27

塞蒂恩:我做了十足的准备,没人愿看到这个局面;距榜首只有2分

直播吧 浏览 241 09-01

美国白宫推出官方TikTok账号:传达特朗普的各项政策

鲁中晨报 浏览 11925 08-21

增程车 CLTC 纯电续航首超 450km,智己预热 8 月 1 日发布会

IT之家 浏览 2927 07-24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11