关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:013569人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

京东启动校招,将开放3.5万个岗位

第一财经资讯 浏览 4076 07-28

俄堪察加地震震级修正为8.7级 可能会引发越洋海啸

财联社 浏览 5813 07-30

当“蔚小理”跌出头部:2026车企淘汰赛全面加速

首席商业评论 浏览 253 01-02

官方:扎尼奥洛因在青年比赛后攻击2名罗马球员被罚1.5万欧

懂球帝 浏览 2539 07-15

沉默的荣耀大结局前瞻,最惨角色出炉,果然不幸的人各有各的不幸

娱乐圈笔娱君 浏览 399 10-17

纳指再创新高,苹果本周累涨逾13%

第一财经资讯 浏览 2331 08-09

王楚钦横扫帕尔采访!太久没打直呼生疏,亲承中国是最好办赛环境

篮球资讯达人 浏览 285 02-05

"明珠"概念首次落地 荣威M7 DMH上市限时8.58万起

网易汽车 浏览 405 09-18

红不过十天就塌房!男星田栩宁疑似孕期出轨?

萌神木木 浏览 9837 07-09

杨天真:杨子姗6年贡献,解约时连20字祝福都吝啬

阿废冷眼观察所 浏览 426 09-21

朝鲜公布朝军在库尔斯克地区作战画面

参考消息 浏览 298 08-25

无视千万索赔,英力士求偿百万:热刺勾串奥迪在先

体坛周报 浏览 464 08-21

“工业机器人曾是日本的堡垒,但中国已开始在新轨道上竞争”

观察者网 浏览 274 12-15

标配华为全家桶 尚界H5上市售15.98万元起

网易汽车 浏览 437 09-25

中国羽毛球价格上涨 世界羽联表态:情况尚未达到危机

环球时报国际 浏览 465 09-01

注册资本200亿!比东风多44亿,新央企在重庆,中国长安汽车集团,来了!

穿透公司 浏览 7477 07-29

姆巴佩反讽式辟谣拒绝担任奥运火炬手:我还说过想当法国男篮控卫

直播吧 浏览 5331 07-26

今年夏天最流行的裙子,配这4双鞋才好看!

LinkFashion 浏览 8370 06-10

饭店被罚45万刚收到不予行政处罚决定书:落款5月12日

红星新闻 浏览 1858 07-15

华为云:以AI榫卯,建智能广厦

脑极体 浏览 418 09-20

分子设计迎来AI新纪元:蒙特利尔大学让计算机成为"分子工程师"

科技行者 浏览 308 01-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11