关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:013495人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

拉科布声明未来2年所有人将在一起 这意味着勇士不引援了?

仰卧撑FTUer 浏览 274 10-18

一艘船多付620万美元 美方尝到中方反制滋味后改限令

梁讯 浏览 241 10-13

小德:我的25个大满贯冠军和C罗的1000个进球也许能一起实现

懂球帝 浏览 180 12-29

天溯计量夫妻控股近九成,税补占比高,逾期应收数千万元

权衡财经 浏览 5976 07-29

曝辛巴出走香港被带走,面临多项指控,知情人曝问题性质很严重

扒虾侃娱 浏览 361 09-06

车机升级 第五代宏光MINIEV将于3月下旬上市

车质网 浏览 108 03-17

比亚迪长城“交卷”,谁都不是“恒大”

字母榜 浏览 367 09-02

一天两枚火箭发射失利 中国航天科技集团发文回应

每日经济新闻 浏览 188 01-19

其实,零百加速5秒的新规才是利好车企

速度计 浏览 185 11-17

夫妻闪婚闪离后互相伤害 女方找人男扮女装"报复"前夫

上观新闻 浏览 729 09-11

阿维塔第21万辆正式下线

三言科技 浏览 187 10-27

官方通报餐馆发蛤蟆汤照片拟罚45万:执法不当 5人停职

北京青年报 浏览 1681 07-15

卫衣+半裙=早秋流行混搭套路,时髦极了!

Yuki女人故事 浏览 270 09-20

业内人士:拟修订多晶硅单位产品综合能耗标准 以推动落后产能出清

科创板日报 浏览 1932 07-24

追梦21年奇瑞终上市,尹同跃身价直追王传福魏建军?

BT财经 浏览 405 09-10

企业员工外派半月后轻生:家属质疑工作压力大企业否认

澎湃新闻 浏览 564 08-11

特朗普没想到,忠心“小弟”要叛变

浏览 8062 07-14

收评:沪指涨超1%逼近4000点 两市放量超3600亿

财联社 浏览 247 10-28

马克龙宣布将正式承认巴勒斯坦国 鲁比奥:美强烈反对

扬子晚报 浏览 10799 07-26

31岁护士被同居男友杀害 父亲:女儿之前从没谈过对象

环球网资讯 浏览 2483 07-18

中俄互免签证,娶俄罗斯媳妇方便了,为何选择这个时机互免?

北向财经 浏览 311 09-09
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11