关闭广告

小语种恐被AI时代边缘化?多国专家呼吁:语言模型不能只服务大语种!

第一财经资讯2025-07-29 12:00:017327人阅读

“巴别鱼”是英国作家道格拉斯·亚当斯在1979年出版的科幻小说《银河系漫游指南》中创造的虚构生物——这种外形呈黄色水蛭状、寄生在宿主耳道内的神奇生物能够突破语言障碍,实现跨物种的语言交流。

翻译机的出现已经打破了人类语言的隔阂,让人们能够自由交流。然而进入AI时代,由于大部分的通用大模型对低资源语言的支持严重不足,使得小语种国家仍面临被时代边缘化的风险。

在今年的上海世界人工智能大会(WAIC)的一场高级别高水平多语言基座大模型国际学术研讨会上,来自近20个国家的约30位语言专家和人工智能专家就如何弥合AI语言模型的鸿沟,实现普惠AI技术进行深入探讨。

专家认为,如果语言被技术遗忘,那么使用这个语言的群体也会被时代遗忘;而只有当小语种国家的孩子也能够用自己的母语向AI提问时,AI平权才真正实现了。

塞尔维亚语是流行在东欧巴尔干半岛前南斯拉夫诸国的一种语言。然而,该语言的使用率远低于同一地区的斯洛文尼亚语。塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出,塞尔维亚语在通用模型中token占比不足0.1%!

“语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”Delić表示。他还称,这对于人工智能在医疗、法律等关键领域的普及非常重要,必须构建符合本国语言特点和文化语境的国家级大模型。

匈牙利语具有极度复杂的词缀组合及自由语序,这为大语言模型token的划分等带来独特挑战。对此,匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中方回应冯德莱恩涉华言论:需要再平衡的是欧方心态

外交部网站 浏览 2850 07-10

陈幸同击败孙颖莎首次登顶WTT冠军赛:有点儿不敢相信

文汇报 浏览 589 08-12

中国儒意如何消化万达“弃子”

华尔街见闻官方 浏览 3785 07-27

科大讯飞AI创新成果亮相第十届版博会

中安在线 浏览 265 10-18

辛芷蕾接棒巩俐拿影后,85花格局大变,杨幂等人危险了!

不八卦会死星人 浏览 336 09-11

中国台北男篮惨败40分:双星11中2提前缴械 D组第2将战约旦争出线

颜小白的篮球梦 浏览 2546 08-10

苏媒:苏超有71人来自南通青训,逾1/4进球由南通青训球员打进

直播吧 浏览 1806 08-13

美网混双:百万美元砸出来的网球明星秀

网球之家 浏览 446 08-21

罗布森:2013年以来曼联换了太多教练,至少得给教练三年时间

懂球帝 浏览 316 09-21

医药新股闹涨“A+H市场”

北京商报 浏览 176 12-11

马杜罗在纽约首次“出庭” 多国发表联合声明

环球网资讯 浏览 197 01-06

大众 CEO 奥博穆谈比亚迪竞争:可以迫使自己做得更好

IT之家 浏览 9875 07-14

跟队记者:尤文未来几小时恢复穆阿尼谈判,尽可能接近巴黎的要价

直播吧 浏览 866 07-17

科学家构建三合一原位X射线平台,揭示CO₂电解中催化剂降解机制

DeepTech深科技 浏览 274 10-27

余承东:鸿蒙5终端数量突破千万

观察者网 浏览 7836 07-30

理想i8能否截胡成功 就看乐道L90的产能了

网易汽车 浏览 10450 08-06

王菲辛苦养大李嫣,谁料竟便宜了李亚鹏?

策略剖析 浏览 479 08-12

剥离与辉同行后东方甄选营收跌三成,俞敏洪:身处暴风骤雨之中,爆发性增长需等待时机

澎湃新闻 浏览 459 08-23

王宝强离婚9年,儿女争光,现让马蓉高攀不起

阿废冷眼观察所 浏览 5954 07-30

文班接受加内特指导 此前曾在少林寺练功夫

罗说NBA 浏览 3250 08-07

戴奇:阿森纳不只靠定位球得分;与津琴科沟通过提前结束租借

懂球帝 浏览 189 01-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11