关闭广告

小语种恐被AI时代边缘化?多国专家呼吁:语言模型不能只服务大语种!

第一财经资讯2025-07-29 12:00:016761人阅读

“巴别鱼”是英国作家道格拉斯·亚当斯在1979年出版的科幻小说《银河系漫游指南》中创造的虚构生物——这种外形呈黄色水蛭状、寄生在宿主耳道内的神奇生物能够突破语言障碍,实现跨物种的语言交流。

翻译机的出现已经打破了人类语言的隔阂,让人们能够自由交流。然而进入AI时代,由于大部分的通用大模型对低资源语言的支持严重不足,使得小语种国家仍面临被时代边缘化的风险。

在今年的上海世界人工智能大会(WAIC)的一场高级别高水平多语言基座大模型国际学术研讨会上,来自近20个国家的约30位语言专家和人工智能专家就如何弥合AI语言模型的鸿沟,实现普惠AI技术进行深入探讨。

专家认为,如果语言被技术遗忘,那么使用这个语言的群体也会被时代遗忘;而只有当小语种国家的孩子也能够用自己的母语向AI提问时,AI平权才真正实现了。

塞尔维亚语是流行在东欧巴尔干半岛前南斯拉夫诸国的一种语言。然而,该语言的使用率远低于同一地区的斯洛文尼亚语。塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出,塞尔维亚语在通用模型中token占比不足0.1%!

“语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”Delić表示。他还称,这对于人工智能在医疗、法律等关键领域的普及非常重要,必须构建符合本国语言特点和文化语境的国家级大模型。

匈牙利语具有极度复杂的词缀组合及自由语序,这为大语言模型token的划分等带来独特挑战。对此,匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

四川今年已披露的最大融资诞生!通威旗下永祥股份逆势吸金49亿

红星资本局 浏览 1919 07-15

听不清、听不到,小心“老年性耳聋”找上门

网易健康 浏览 6258 06-26

汪小菲信守承诺带娃玩,小玥儿正脸太像大S

观察鉴娱 浏览 8018 07-08

成都"隐形富豪"被查:名下只有两间铺子,却赚得比王健林还多

壹只灰鸽子 浏览 3036 07-26

BBC给印度"泼冷水":在制造业存在难以替代中国的短板

环球时报 浏览 3774 05-20

智驾出事网暴车企?权威人士:不赖车企,司机还要被三重“追责”

小李车评李建红 浏览 2482 07-26

30度高温天穿啥?叶童高圆圆的答案可以抄作业

黎贝卡的异想世界 浏览 5947 06-21

光环褪去的特斯拉,这条“鲶鱼”如何面对自主围攻?

禾颜阅车 浏览 4385 07-09

消息称下一代 6.3 英寸小直屏手机至少有 7 台

IT之家 浏览 5341 07-12

特朗普发B-2轰炸机飞行投弹视频 配乐恶搞"轰炸伊朗"

环球网资讯 浏览 6917 06-26

预计四季度上市 方程豹钛7公示

网易汽车 浏览 4697 06-23

万米高空火箭总设计师今年上高二

北青网-北京青年报 浏览 4479 07-09

陈芋汐谈第五次世锦赛:还是特别兴奋,希望有好的表现让自己满意

直播吧 浏览 6890 07-22

图片报:多特不想让阿德耶米进入合同年,明年不续约就出售

直播吧 浏览 374 07-16

孙正义投了一碗面,全是科技与狠活

创业邦 浏览 4792 07-29

河南主帅拉莫斯:这场比赛差距很小,我们拼尽了全力&配得上胜利

直播吧 浏览 2331 07-24

鲁比奥:万斯是2028年总统选举的绝佳候选人

看看新闻Knews 浏览 3401 07-28

香港机场接连有飞机发生故障 多方回应

南方都市报 浏览 8080 05-27

场面热烈,近千名球迷观看马竞训练,西蒙尼请求球迷保持安静

懂球帝 浏览 2478 07-25

郑钦文领衔,中国军团美网正赛名单出炉!

网球之家 浏览 1572 07-17

董明珠“仇敌”,要IPO了

投资家 浏览 6844 07-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11