关闭广告

小语种恐被AI时代边缘化?多国专家呼吁:语言模型不能只服务大语种!

第一财经资讯2025-07-29 12:00:017331人阅读

“巴别鱼”是英国作家道格拉斯·亚当斯在1979年出版的科幻小说《银河系漫游指南》中创造的虚构生物——这种外形呈黄色水蛭状、寄生在宿主耳道内的神奇生物能够突破语言障碍,实现跨物种的语言交流。

翻译机的出现已经打破了人类语言的隔阂,让人们能够自由交流。然而进入AI时代,由于大部分的通用大模型对低资源语言的支持严重不足,使得小语种国家仍面临被时代边缘化的风险。

在今年的上海世界人工智能大会(WAIC)的一场高级别高水平多语言基座大模型国际学术研讨会上,来自近20个国家的约30位语言专家和人工智能专家就如何弥合AI语言模型的鸿沟,实现普惠AI技术进行深入探讨。

专家认为,如果语言被技术遗忘,那么使用这个语言的群体也会被时代遗忘;而只有当小语种国家的孩子也能够用自己的母语向AI提问时,AI平权才真正实现了。

塞尔维亚语是流行在东欧巴尔干半岛前南斯拉夫诸国的一种语言。然而,该语言的使用率远低于同一地区的斯洛文尼亚语。塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出,塞尔维亚语在通用模型中token占比不足0.1%!

“语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”Delić表示。他还称,这对于人工智能在医疗、法律等关键领域的普及非常重要,必须构建符合本国语言特点和文化语境的国家级大模型。

匈牙利语具有极度复杂的词缀组合及自由语序,这为大语言模型token的划分等带来独特挑战。对此,匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

房子白菜价的鹤岗开建机场 城市插上腾飞的翅膀

上游新闻 浏览 42207 08-28

副部级赵金云被公诉:大搞家庭式腐败 丈夫也已落马

扬子晚报 浏览 5017 07-30

2天内2名"老虎"被判死缓 1人从县委书记贪腐到副部

上观新闻 浏览 3338 07-10

杨振宁留给中国的最重要遗产,恰恰很不“中国味”

钛媒体APP 浏览 266 10-20

上海老教授花600万借孙女名字买房 结果要不回来了

都市快报橙柿互动 浏览 245 11-17

吃梅婷6年软饭,出轨李小冉惨遭断手断脚,今和梅婷差距天上地下

阅识 浏览 269 10-01

北京一副局长骑电动车送外卖,“原以为骑手最关心社保政策,没想到他们张口就是‘别罚我款’”

第一财经资讯 浏览 196 12-21

美防长要求数百名军方将领下周紧急集结

界面新闻 浏览 430 09-26

雅斯特酒店回应房客发病送药不及时死亡:送药者未告知病情,隐私考虑未查看药品

封面新闻 浏览 199 11-25

媒体人:湖人希望詹姆斯赛季后退役;詹姆斯与湖人已陷入冷战

懂球帝 浏览 299 10-11

存强制退市风险 元道通信涉嫌年报等虚假记载被立案

经济观察报 浏览 9723 07-13

我们复盘了会稽山的“网红路”,发现“黄酒复兴”还为时尚早

阿尔法工场 浏览 390 09-01

北青:新加坡籍国际级裁判塔基很可能将执法上海德比

懂球帝 浏览 3257 08-07

一年狂揽60亿融资!13大玩家厮杀无人配送,阿里京东美团都入局了

车东西 浏览 154 02-05

是颜值派更是实力派,李斯丹妮的高能生活不设限

时尚COSMO 浏览 185 12-31

分析称iPhone 17将在更多国家和地区取消SIM卡槽

IT之家 浏览 363 09-01

特朗普一反常态对中方发出邀请 中国面对陷阱不能上当

空天力量 浏览 476 09-01

B站:BW2025较2024年上涨15万人次

网易科技报道 浏览 9058 07-14

杨议也没想到,郭德纲这次没给他留“一丝体面”

观察鉴娱 浏览 952 07-13

业主私挖300平地下室:白天用挖机挖 半夜偷偷运土

扬子晚报 浏览 310 10-14

中国拿出比稀土更致命的王牌美国"破防" 万斯:要冷静

时时有聊 浏览 303 10-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11