关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:013500人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

里尔总监:即使帕瓦尔愿意回归,我们也无力承担转会费

直播吧 浏览 428 08-23

十分亮眼,阿马德5场非洲杯比赛贡献3球1助,3次获得全场最佳

懂球帝 浏览 185 01-12

特朗普称美国正以“前所未有的速度储备武器”

环球网资讯 浏览 9590 06-04

国内独家,AI、机器人双龙头,放手一搏!

飞鲸投研 浏览 3788 07-31

美记:快船和小帕特里克-鲍德温&小泰泰-华盛顿签下训练营合同

直播吧 浏览 9241 08-10

外研社回应"孙颖莎出现在小学英语教材":未最终定稿

现代快报 浏览 4790 06-09

格陵兰岛称选择丹麦和欧盟 已准备好迎接更大规模军事存在

国际在线 浏览 175 01-23

京东七鲜小厨公布数据:首店开业一周日均单量1000+

网易科技报道 浏览 5898 07-31

谁说红毯比美一定要劲劲的?

时尚COSMO 浏览 369 09-05

光伏重大资产重组终止

21世纪经济报道 浏览 182 12-21

余承东自曝:华为Pura 80标准版7月23日开启预售

快科技 浏览 6373 07-21

演员李小冉回应误删何炅微信:因为没有备注实名

极目新闻 浏览 7038 07-28

半导体鼻祖,被中国对手“卷”到悬崖边

汽车公社 浏览 440 05-29

白家犯罪细节披露:强迫20名女子卖淫 不接客关小黑屋

央视新闻 浏览 2291 07-12

中科院发文,50岁是“断崖式衰老”元年

网易科技报道 浏览 9658 07-29

周定洋社媒庆祝绝平申花:让我们继续拼、继续冲,一场一场来!

直播吧 浏览 342 09-22

上海家化改革成效显著:上半年营收利润双增,发布业绩次日股价涨停

时代周报 浏览 390 08-25

斯坦福大学团队推出「许可证神谕」:让AI学会说「我不知道」

科技行者 浏览 182 01-23

杠杆资金加速涌入!单日净流入创年内新高,业内:风险整体可控

券商中国 浏览 448 08-20

巴基斯坦与沙特阿拉伯签军事协议 多国受震动

环球网资讯 浏览 335 09-19

董璇张维依三亚带娃,这才是家庭最舒服的样子

吴霶爱体育 浏览 121 02-24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11