关闭广告

小语种恐被AI时代边缘化?多国专家呼吁:语言模型不能只服务大语种!

第一财经资讯2025-07-29 12:00:017126人阅读

“巴别鱼”是英国作家道格拉斯·亚当斯在1979年出版的科幻小说《银河系漫游指南》中创造的虚构生物——这种外形呈黄色水蛭状、寄生在宿主耳道内的神奇生物能够突破语言障碍,实现跨物种的语言交流。

翻译机的出现已经打破了人类语言的隔阂,让人们能够自由交流。然而进入AI时代,由于大部分的通用大模型对低资源语言的支持严重不足,使得小语种国家仍面临被时代边缘化的风险。

在今年的上海世界人工智能大会(WAIC)的一场高级别高水平多语言基座大模型国际学术研讨会上,来自近20个国家的约30位语言专家和人工智能专家就如何弥合AI语言模型的鸿沟,实现普惠AI技术进行深入探讨。

专家认为,如果语言被技术遗忘,那么使用这个语言的群体也会被时代遗忘;而只有当小语种国家的孩子也能够用自己的母语向AI提问时,AI平权才真正实现了。

塞尔维亚语是流行在东欧巴尔干半岛前南斯拉夫诸国的一种语言。然而,该语言的使用率远低于同一地区的斯洛文尼亚语。塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出,塞尔维亚语在通用模型中token占比不足0.1%!

“语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”Delić表示。他还称,这对于人工智能在医疗、法律等关键领域的普及非常重要,必须构建符合本国语言特点和文化语境的国家级大模型。

匈牙利语具有极度复杂的词缀组合及自由语序,这为大语言模型token的划分等带来独特挑战。对此,匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

你认同吗?罗德曼分享他的总统山人选:乔詹库&魔术师!

直播吧 浏览 211 09-01

5999.2元!华硕灵耀 14 2025 喜迎福利:移动办公首选生产力

IT之家 浏览 1456 07-16

多名革命卫队指挥官、核科学家身亡,哈梅内伊高级顾问重伤

澎湃新闻 浏览 965 06-14

中国车企上半年销量,比亚迪第一吉利第二,第五你想不到

Nice好车 浏览 9875 07-03

海南华铁“失算”疑云:36.9亿元“三无”合约终止,阿里云前高管参与,“牛散”结伴进退

证券时报e公司 浏览 103 10-13

犯罪团伙大胆却“业余”,珠宝黑市隐蔽且暴利,FBI前探员拆解卢浮宫劫案

环球网资讯 浏览 99 10-24

普京与金正恩通电话

新京报 浏览 7237 08-13

长沙现"假装上班公司":20元买一个工位 自由安排时间

潇湘晨报 浏览 271 08-28

以军多次袭击加沙 哈马斯谴责其违反停火协议

环球网资讯 浏览 29 11-23

至高享价值48800元限时购车礼 猛士M817 Hero售30.19万

网易汽车 浏览 26 11-25

贵州茅台酒五星商标70周年款将上架 每瓶或定价7000元

界面新闻 浏览 1482 08-06

因泄露机密信被小米辞退,王腾再回应:有失职但没违法

国际金融报 浏览 171 09-10

突然爆雷!刚刚,暴跌超25%!

券商中国 浏览 8971 08-12

帕金斯:和我聊过的球员都看好库明加 说他放开抡能全明星+最佳阵

直播吧 浏览 3143 07-28

台"馆长"称"把赖清德狗头斩下来" 遭民进党当局约谈

环球时报新闻 浏览 154 10-09

两大退市风险缠绕,信披违规的*ST苏吴受损股民可索赔

证券市场周刊 浏览 179 09-11

董璇再婚仅一月,让人担心的事情还是发生了

温读史 浏览 7811 08-13

泽连斯基:反对“用乌克兰领土交换和平”

澎湃新闻 浏览 9936 08-10

荣耀亲选耳夹式耳机2 Pro曝光:金线充电盒加持,支持空间音频

IT之家 浏览 42 11-09

38岁宝妈时隔20年再次高考:曾学新闻 想转型当中医

上游新闻 浏览 3339 06-12

FC26皇马球员内测能力值:姆巴佩&维尼修斯&贝林均为90

懂球帝 浏览 1480 07-30
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11