关闭广告

小语种恐被AI时代边缘化?多国专家呼吁:语言模型不能只服务大语种!

第一财经资讯2025-07-29 12:00:016773人阅读

“巴别鱼”是英国作家道格拉斯·亚当斯在1979年出版的科幻小说《银河系漫游指南》中创造的虚构生物——这种外形呈黄色水蛭状、寄生在宿主耳道内的神奇生物能够突破语言障碍,实现跨物种的语言交流。

翻译机的出现已经打破了人类语言的隔阂,让人们能够自由交流。然而进入AI时代,由于大部分的通用大模型对低资源语言的支持严重不足,使得小语种国家仍面临被时代边缘化的风险。

在今年的上海世界人工智能大会(WAIC)的一场高级别高水平多语言基座大模型国际学术研讨会上,来自近20个国家的约30位语言专家和人工智能专家就如何弥合AI语言模型的鸿沟,实现普惠AI技术进行深入探讨。

专家认为,如果语言被技术遗忘,那么使用这个语言的群体也会被时代遗忘;而只有当小语种国家的孩子也能够用自己的母语向AI提问时,AI平权才真正实现了。

塞尔维亚语是流行在东欧巴尔干半岛前南斯拉夫诸国的一种语言。然而,该语言的使用率远低于同一地区的斯洛文尼亚语。塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出,塞尔维亚语在通用模型中token占比不足0.1%!

“语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”Delić表示。他还称,这对于人工智能在医疗、法律等关键领域的普及非常重要,必须构建符合本国语言特点和文化语境的国家级大模型。

匈牙利语具有极度复杂的词缀组合及自由语序,这为大语言模型token的划分等带来独特挑战。对此,匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

林俊杰自曝患心脏病,唱歌时无法站立表情痛苦

归史 浏览 974 07-15

夏天穿衣“越简单越好看”,看看这27组穿搭范例,舒适又耐看

静儿时尚达人 浏览 1293 06-21

前五角大楼顾问警告:美国导弹库存告急

环球网资讯 浏览 9132 07-19

调查称华盛顿撞机事故中军方直升机飞行高度超限

国际在线 浏览 9772 07-31

上海飞日本航班急降7000米 乘客:无人对接 耳朵很疼

大象新闻 浏览 953 07-02

博主:塞鸟与伊万同属经纪人李锋,归化的初衷显然不是国家队

懂球帝 浏览 7472 07-27

iOS 26公测版发布:视觉交互优化 修复多项问题

网易数码 浏览 9512 07-25

车长突破5.1米 全新问界M7全面靠拢M8/M9

网易汽车 浏览 2225 07-29

男子驾车致女友截瘫后全家失联 男方母亲回应

红星新闻 浏览 5152 07-11

魏建军发长城汽车35周年高管合照 国产大V8超跑要来了吗?

网易汽车 浏览 4941 07-23

记者:恩迪迪更可能前往德甲而非英超,其解约金已降至900万镑

直播吧 浏览 3375 07-18

Labubu爆火、泡泡玛特业绩大增,市场为何不买账?|智氪

36氪财经 浏览 3192 07-29

财政部退出!中央汇金接手中国农再55.9%股权,持牌险企增至5家

时代周报 浏览 4250 07-31

歼-10首飞画面来了 追梦者讲述“争气机”传奇

国际在线 浏览 7571 06-04

巴特勒盛赞布克单打能力:他会一边倒获胜!可以11投10中

Emily说个球 浏览 8388 07-21

美国费城发生大规模枪击事件 已致2死9伤

界面新闻 浏览 1105 05-28

德官员强硬回应美关税:若他们想要战争 就会得到战争

环球时报国际 浏览 5705 07-22

iQOO Z10 Turbo Pro 手机获 UFCS 认证

IT之家 浏览 1762 07-16

记者:哈伊杜克有意雷比奇&正商谈工资,不会为其打破薪资结构

直播吧 浏览 4081 07-26

2025年上半年中国汽车销量占全球份额达36% 同比增长3%

智车情报局 浏览 4391 07-29

低空经济起飞!含金量最高的通用航空ETF来了

新经济e线 浏览 6160 07-30
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11