关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:013317人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

AI产业迅速发展需求增长 光模块市场或仍将维持高增速

金证研 浏览 1960 07-17

唏嘘!35岁苏宁功勋遭官宣解约,曾在中超5年赚5亿+险被国足归化

我爱英超 浏览 213 09-11

人均100吃出上千仪式感!“板前模式”爆发了

餐饮老板内参 浏览 5536 07-28

一手好牌打稀烂!疯马秀过一年半 张嘉倪近况曝出

艳儿说电影 浏览 5425 07-21

关系藏不住了?小S二女儿被曝恋情

小梊搞笑解说 浏览 106 10-16

北芯生命:核心产品与新技术竞争关系陷罗生门 自称“金标准”背后技术路径现疑云

金证研 浏览 242 08-29

2024年最赚钱的车企,有家车企销量下滑,利润最高

星星car 浏览 242 05-26

翟潇闻粉丝掀桌三搭,无牌硬耍还是破圈无门?

八卦三缺一 浏览 2499 07-22

深耕跨境金融服务 宁波银行打造护航企业出海“标杆”

阿尔法工场 浏览 4557 07-16

北京现代2025年上半年销量稳步回升,6月增长势头强劲

汽车有文化 浏览 4169 07-03

极氪被指卖"0公里二手车"虚增销量 官方:正常商业行为

鲁中晨报 浏览 10032 07-21

iPhone 17 Air续航告急,苹果或祭出硅碳电池

网易科技报道 浏览 181 09-09

40岁女性可以看看这些穿搭,每一套都可以借鉴一下,高级大方

静儿时尚达人 浏览 3581 07-15

天安门广场核心区布置基本就绪 新增临时观礼台

央视新闻客户端 浏览 166 08-30

近期一些地方仍然出现校园食品安全问题 教育部回应

极目新闻 浏览 156 09-24

国产光刻机... ...

诗与星空 浏览 181 09-21

成龙 李连杰 周星驰都老了,而他看起来却年轻了?

手工制作阿歼 浏览 217 09-01

官方:40岁波兰门将法比安斯基回归西汉姆联,双方签约一年

懂球帝 浏览 183 09-11

当学科边界被打破:四位顶尖科学家共议“交叉科学”的未来

封面新闻 浏览 150 09-29

伊姐十一热推:电影《阿凡达:水之道》;电影《毕正明的证明》......

伊周潮流 浏览 96 10-08

成立半年后,四川能源发展集团有望迎来首家“A+H”上市公司,旗下华海清科拟赴港上市

红星资本局 浏览 216 09-01
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11