关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者2025-11-09 00:00:01328人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美团外卖大战总指挥:不想卷 但不能不反击

晚点LatePost 浏览 1159 07-17

伊朗高级将领:若遭美国攻击 以色列将成为首要报复目标

极目新闻 浏览 260 02-05

“Go Global”战略里程碑进展!远大医药钇[90Y]欧洲新增适应症获批

环球网资讯 浏览 462 09-09

电讯报:诺丁汉森林想签新边锋,有意阿达玛-特劳雷&本-多克等人

直播吧 浏览 2289 07-29

外媒:扎克伯格态度转变 Meta使用阿里千问优化其最新AI模型

环球网资讯 浏览 299 12-11

吉利汽车5月销量23.76万辆 连续三月双增创出口新高

网易汽车 浏览 63 06-02

美联储分歧又现:有人称关税对通胀影响不会持久,有人预计影响到明年

华尔街见闻官方 浏览 10676 07-11

2天票房破2.3亿,但凡给成龙多点排片量,《浪浪山》日冠就不保了

娱乐圈笔娱君 浏览 421 08-19

官媒:中俄联合演习期间 一些国家的飞机舰船不断出现

政知新媒体 浏览 9303 08-06

17.68万起!搭载全新图灵AI芯片 2026款小鹏G6/G9上市

网易汽车 浏览 292 01-09

葡萄牙3-2逆转绝杀!40岁C罗5连斩加冕世预赛射手王

侃球熊弟 浏览 421 09-10

芯迈半导体二度递表,专利超300项!获国家级资本加持|港E声

时代周报 浏览 296 01-09

耀才证券澄清传言,蚂蚁斥资28亿港元补“短板”!

独角金融 浏览 535 08-20

去年城镇犬猫消费市场规模突破3000亿元,专家称企业应满足“情感溢价”

红星资本局 浏览 452 09-22

52岁“不婚不育”的苏有朋,走上了另一条路?

包饺子ai剪辑 浏览 467 08-20

被预言活不过6岁的少年考上浙江中医大 身上37枚钢钉

极目新闻 浏览 1865 07-29

或惹恼中国 越南与美提前达成贸易协议遭本国企业质疑

澎湃新闻 浏览 2463 07-15

郭芙蓉自由了,我却还留在同福客栈

时尚COSMO 浏览 208 01-07

中国商飞:柬埔寨拟采购20架C909客机

每日经济新闻 浏览 433 09-11

被指要求本土企业避免使用英伟达H20芯片 外交部回应

界面新闻 浏览 1937 08-14

张译演技翻车?《以法之名》再演正派被骂固化,观众:不如史今

娱乐白名单 浏览 10393 07-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11