关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者2026-01-13 00:00:01191人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

法官毕祺祺涉洗钱犯罪被批准逮捕 曾因"为母辩护"走红

江苏新闻 浏览 1491 08-11

小鹏汽车预计四季度盈利

汽势传媒 浏览 448 08-23

北京拿下“五万亿之城”,为何还成了AI之城?

BT财经 浏览 144 02-24

华为提出行业智能化「三步走」路径,为产业AI落地破题

36氪 浏览 303 09-21

印航波音787坠机事件出现最新进展, 调查集中在飞行员操作

第一财经资讯 浏览 5953 07-12

亏损超1.94亿,请来三国明星也不行,我感慨:这块金字招牌砸了‌

靠谱电影君 浏览 357 09-11

特朗普与普京长时间通话 “会晤”与“战斧”成话题

极目新闻 浏览 268 10-17

王毅谈及泰柬边境争端 泰国外长:感谢中方

环球网 浏览 5392 07-12

消失8年,这T0级演员突然复出了

独立鱼 浏览 273 11-04

特斯拉Optimus机器人量产遇挫:年产量远不及预期,仅数百台交付

环球网资讯 浏览 5245 07-26

女子143万购铺想靠租金养老 发现月租虚高解约被索赔

封面新闻 浏览 525 08-20

白银又暴涨了!

国际金融报 浏览 377 09-02

斜肩上衣+半身裙,清凉松弛显气质!

Yuki女人故事 浏览 7162 07-14

被问与特朗普关系是否已"破裂" 斯塔默回应

环球网资讯 浏览 101 04-10

罕见联合演练指挥导调现场公布:画面多处打码

环球网资讯 浏览 1130 08-03

净利暴增超50%!CXO龙头药明生物,否极泰来

侃见财经 浏览 1610 07-25

男子开车出车祸致25岁女友截瘫 承诺结婚后全家失联

极目新闻 浏览 3443 07-09

第十届四川省大学生机器人大赛在成都启幕

封面新闻 浏览 271 10-26

豫媒:全省上下的支持,是河南队冲击足协杯冠军的最大底气

懂球帝 浏览 412 08-23

青艾文宿:酉州古城里的土家智慧居停

商界 浏览 439 08-22

那英老公被曝出轨!跟女子举止亲密,那英多次维护男方成笑话

萌神木木 浏览 321 09-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11