关闭广告

小语种恐被AI时代边缘化?多国专家呼吁:语言模型不能只服务大语种!

第一财经资讯2025-07-29 12:00:017411人阅读

“巴别鱼”是英国作家道格拉斯·亚当斯在1979年出版的科幻小说《银河系漫游指南》中创造的虚构生物——这种外形呈黄色水蛭状、寄生在宿主耳道内的神奇生物能够突破语言障碍,实现跨物种的语言交流。

翻译机的出现已经打破了人类语言的隔阂,让人们能够自由交流。然而进入AI时代,由于大部分的通用大模型对低资源语言的支持严重不足,使得小语种国家仍面临被时代边缘化的风险。

在今年的上海世界人工智能大会(WAIC)的一场高级别高水平多语言基座大模型国际学术研讨会上,来自近20个国家的约30位语言专家和人工智能专家就如何弥合AI语言模型的鸿沟,实现普惠AI技术进行深入探讨。

专家认为,如果语言被技术遗忘,那么使用这个语言的群体也会被时代遗忘;而只有当小语种国家的孩子也能够用自己的母语向AI提问时,AI平权才真正实现了。

塞尔维亚语是流行在东欧巴尔干半岛前南斯拉夫诸国的一种语言。然而,该语言的使用率远低于同一地区的斯洛文尼亚语。塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出,塞尔维亚语在通用模型中token占比不足0.1%!

“语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”Delić表示。他还称,这对于人工智能在医疗、法律等关键领域的普及非常重要,必须构建符合本国语言特点和文化语境的国家级大模型。

匈牙利语具有极度复杂的词缀组合及自由语序,这为大语言模型token的划分等带来独特挑战。对此,匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

发改委:创业投资类基金要围绕发展新质生产力

国家发展改革委 浏览 4549 07-30

38岁何洁二婚丈夫刁磊,已经开始为她“争光”了

余鴡搞笑段子 浏览 352 11-12

都体:在战平维罗纳赛后加练中,布雷默因为过度疲劳突然倒地

懂球帝 浏览 434 09-21

美军重兵集结蓄力作战之际 新一轮美伊谈判时间“敲定”

环球网资讯 浏览 266 02-23

湖南一营地因纠纷被倒土封路 游客挖土2小时才离开

潇湘晨报 浏览 5167 07-23

老公为给小白花铺路,将刚满月的儿子送去演戏,这种男人我不要了

阿漫阅读 浏览 423 09-18

张伯伦是历史唯一单场双40+的球员 共8次达成得分篮板双40+

直播吧 浏览 2215 07-31

杜加利奇解释离队:不是竞技因素和经济问题,原因在于一个人

懂球帝 浏览 278 12-15

美国航空一客机发动机起火返航 无人受伤

上观新闻 浏览 850 06-26

银华基金主动权益基金溃败 39只基金过去3年最大回撤40%+

网易财经 浏览 3334 07-16

AI音频生成重要突破!清华×生数科技最新研究被ACM顶会收录

智东西 浏览 1392 07-24

蔚来跌超6%三季度亏30亿,理想由盈转亏,零跑盈利,造车新势力洗牌加剧

21世纪经济报道 浏览 300 12-02

12.99万元起 长安启源A07超长蓝鲸纯电版/增程版焕新上市

网易汽车 浏览 469 09-11

纯电续航达550km 吉利银河A7 EV官图发布

车质网 浏览 177 04-08

核心产品已在轨数十台套,激光通信光传输链路解决方案提供商「聿凡领光」完成数千万元Pre-A轮融资|36氪首发

36氪 浏览 587 08-20

美被指允许恢复向中国商飞供喷气发动机

环球网资讯 浏览 10069 07-04

二排座椅配按摩 新款领克09四驱探索版限时价19.88万起

网易汽车 浏览 372 10-24

三星Galaxy Z Fold7拆解:折叠屏维修难度大,可维修性仅3分

IT之家 浏览 1350 08-06

马卡:赫伊森在高强度比赛中表现糟糕,他需要提升防守硬度

懂球帝 浏览 326 11-05

AMD ROCm 软件堆栈更新至 7.0.2 版本,支持 Radeon RX 9060 显卡

IT之家 浏览 370 10-13

印度一架飞往伦敦的客机坠毁 系波音787机型首起空难

界面新闻 浏览 6024 06-13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11