关闭广告

小语种恐被AI时代边缘化?多国专家呼吁:语言模型不能只服务大语种!

第一财经资讯2025-07-29 12:00:017409人阅读

“巴别鱼”是英国作家道格拉斯·亚当斯在1979年出版的科幻小说《银河系漫游指南》中创造的虚构生物——这种外形呈黄色水蛭状、寄生在宿主耳道内的神奇生物能够突破语言障碍,实现跨物种的语言交流。

翻译机的出现已经打破了人类语言的隔阂,让人们能够自由交流。然而进入AI时代,由于大部分的通用大模型对低资源语言的支持严重不足,使得小语种国家仍面临被时代边缘化的风险。

在今年的上海世界人工智能大会(WAIC)的一场高级别高水平多语言基座大模型国际学术研讨会上,来自近20个国家的约30位语言专家和人工智能专家就如何弥合AI语言模型的鸿沟,实现普惠AI技术进行深入探讨。

专家认为,如果语言被技术遗忘,那么使用这个语言的群体也会被时代遗忘;而只有当小语种国家的孩子也能够用自己的母语向AI提问时,AI平权才真正实现了。

塞尔维亚语是流行在东欧巴尔干半岛前南斯拉夫诸国的一种语言。然而,该语言的使用率远低于同一地区的斯洛文尼亚语。塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出,塞尔维亚语在通用模型中token占比不足0.1%!

“语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”Delić表示。他还称,这对于人工智能在医疗、法律等关键领域的普及非常重要,必须构建符合本国语言特点和文化语境的国家级大模型。

匈牙利语具有极度复杂的词缀组合及自由语序,这为大语言模型token的划分等带来独特挑战。对此,匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

港交所业绩创新高,港股券商也跟着“吃肉”,富途控股半年营收超百亿

时代周报 浏览 519 08-23

曝大S骨灰做成7条项链,范玮琪演唱会上疑似佩戴

扒虾侃娱 浏览 345 10-29

全球数百美军高级将领突然被召回 特朗普发声

环球网资讯 浏览 411 09-26

每体:特尔施特根已进行轻度训练,但还需至少1个月康复

懂球帝 浏览 353 10-31

渣女衫+半裙、短上衣+阔腿裤,今夏最in穿搭,照着穿美炸了

Yuki女人故事 浏览 2375 07-28

国债被"抛售"债市遭暴击 日本或在未来面临金融风暴

红星新闻 浏览 427 12-05

3女子在贵州买避暑房 散步被大树砸倒致1死2伤获赔偿

大风新闻 浏览 637 08-17

稳住下半年,沃尔沃选择彻底中国化

汽车公社 浏览 1543 07-29

华为手表星闪(NearLink)功能介绍发布

IT之家 浏览 6393 07-14

降入20万价格区间 曝廉价版特斯拉即将国产

车质网 浏览 341 10-14

豪门狗血...

越女事务所 浏览 9940 07-14

美股,涨爆了!A股,怎么走?

金石随笔 浏览 133 05-06

柬埔寨:本次冲突系泰方先开火 且动用重型武器及战机

央视新闻客户端 浏览 4630 07-25

9岁女孩在埃及飚英语维权:8个月起就跟爸爸"浪迹天涯"

潇湘晨报 浏览 220 03-11

荣梓杉出轨约妹照曝光!与李禹熹控诉时间吻合,还曾要求对方删照

萌神木木 浏览 285 10-16

中方接连被美国暗中"做局" 两个国家几乎同时对华出手

头条爆料007 浏览 294 02-02

正部级吴英杰被判死缓 曾被批严重影响西藏高质量发展

界面新闻 浏览 3655 07-17

2000一张票的世界人工智能大会,最好看的竟然是机器人?

差评XPIN 浏览 2829 07-29

俄军空袭乌克兰首都基辅 供电供暖大范围中断

界面新闻 浏览 293 12-28

外媒:特朗普反复威胁 欧洲领导人已感到厌倦

参考消息 浏览 114 05-06

国内首款单曝光压缩光谱成像技术高光谱成像相机研发成功

IT之家 浏览 8390 07-31
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11