关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:013315人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

深铁再救万科220亿,暗藏的动作太多了

大猫财经Pro 浏览 66 11-04

吉利一季度盈利大增 归母净利润56.7亿同比增264%

网易汽车 浏览 268 05-16

夏联-开拓者大胜勇士 杨瀚森首秀10+4+5+3帽

网易体育 浏览 6362 07-13

夫妻工地干活时女儿从13楼坠亡索赔89万 法院判了

极目新闻 浏览 1652 08-09

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者 浏览 72 10-31

埃尔法最大竞品复活了,这台新出的日系MPV有点酷!

汽车消费网 浏览 78 10-31

匿名者向五角大楼捐赠1.3亿美元 支付政府停摆期间美军薪资

澎湃新闻 浏览 81 10-27

票房破13亿,只是个开始

皮皮电影 浏览 139 09-29

《生万物》里3位“星二代”,个个都大有来头

广西阿妹香香 浏览 233 08-21

将面强敌,曼城国际比赛日后7天内连战曼联&那不勒斯&阿森纳

懂球帝 浏览 229 09-01

此前发生严重空难的印度航空宣布缩减窄体机航班数量

财联社 浏览 3418 06-23

购置税红利倒计时,头部车企上演“兜底”大战

汽车点评AC 浏览 77 10-28

迈向AI汽车公司 全新小鹏P7亮相慕尼黑车展

网易汽车 浏览 192 09-09

携程、同程、抖音、美团、飞猪被约谈

华尔街见闻官方 浏览 1576 08-06

太阳报:切尔西在主场展示奖杯,门票售价5英镑但球迷不多

懂球帝 浏览 4774 08-07

米体:圣西罗审批将推迟至9月,出售给国米和AC米兰仍有可能

懂球帝 浏览 2370 07-21

李开复,在成都投了一家“0卡糖”

投中网 浏览 131 10-13

女人“优雅到老”并不难,别随便穿衣,这4个方法真的超实用

静儿时尚达人 浏览 3783 07-12

英伟达H20芯片出口许可获批

北京商报 浏览 5254 07-16

网传7月购车一口价取消了,是真是假?

吴佩频道 浏览 3527 07-11

胡塞武装称若加沙停火破裂将恢复袭击以色列

极目新闻 浏览 37 11-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11