关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者2026-01-13 00:00:01289人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

宝马智驾供应商敲定Momenta,BBA集体拥抱中国科技公司

汽车公社 浏览 4146 07-15

17岁男生与同学云南边境失联 后者在微信群发快救救我

大风新闻 浏览 531 09-09

消失的1.8%,你的钱会发生什么

米筐投资 浏览 221 03-17

900亿市值通威股份,中报亏损近50亿,创下历史最差

华美财经 浏览 487 08-25

昔日珠海"影子首富"被房企跨国追债28亿 法院判决公布

南方都市报 浏览 449 09-06

“人血馒头吃不停”?张兰一反常态怀念大S

老吴教育课堂 浏览 3738 07-22

茶里回应欠薪:大部分在职员工欠薪兑付已完成,离职员工欠薪问题正分批解决

红星资本局 浏览 294 01-15

裁判员唐顺齐被传心梗去世 足协发文强烈谴责相关谣言

新京报 浏览 461 09-09

新能源大三排SUV的猎杀时刻开始了

汽车公社 浏览 177 12-19

上海最大原拆原建小区回搬:始建于1958年 有94种户型

每日经济新闻 浏览 2668 07-17

宋祖德发声:圈内多名女星曾以找释永信开光为荣

可乐谈情感 浏览 3308 07-29

俄罗斯:西方派往乌克兰的士兵都是"合法打击目标"

看看新闻Knews 浏览 240 01-12

男子围猎多名女性自称是"公务员" 有女子给他140万

极目新闻 浏览 156 05-09

2026春夏八大流行趋势,早穿早美!

Yuki女人故事 浏览 293 02-04

释永信老照片流出 21岁的他推师傅看病看起来老实本分

火山詩话 浏览 79 06-02

50多岁的女人,建议少穿暗沉色和大妈装,这样打扮洋气还减龄

静儿时尚达人 浏览 471 09-11

打服了!意大利杂志:东契奇是篮球界最全能球员 精通所有技术环节

直播吧 浏览 384 09-10

普京与美谈崩伊总统宣布访华 前美官员:中美差距拉大

科技有趣事 浏览 608 08-20

杀入50万级市场,极氪拼命向上

网易汽车 浏览 399 10-01

售价40.28万元 2026款丰田GR YARIS上市

网易汽车 浏览 176 04-10

国晟科技迎来光明

富凯财经 浏览 1582 07-15
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11