关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:013495人阅读

IT之家 8 月 13 日消息，FFmpeg 是一个流行的开源媒体播放器通用框架，现在包含了一个新的 af_whisper 音频工具，可以直接在 FFmpeg 生态系统中实现自动语音识别（ASR）。

该工具使用了 whisper.cpp 库，为媒体处理工作流程添加了一个 AI 模型，允许进行灵活的音频转译文本，包括选择 AI 模型、指定语言以及设置输出格式，如文本、SRT 或 JSON。

该工具可以处理预录制的文件和实时音频流，用户还可以使用语音激活检测（VAD）来提高转写的准确性和效率。

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

猜你喜欢

相关阅读

AI，人类历史上最后一次科技革命？你准备好“上桌”了吗

北京商报浏览 282 10-18

男子自称前股东实名举报李雪琴公司财务问题

鲁中晨报浏览 9712 06-18

AI录音设备大混战

华尔街见闻官方浏览 196 01-21

精彩推荐

拉科布声明未来2年所有人将在一起这意味着勇士不引援了？

仰卧撑FTUer 浏览 274 10-18

一艘船多付620万美元美方尝到中方反制滋味后改限令

梁讯浏览 241 10-13

小德：我的25个大满贯冠军和C罗的1000个进球也许能一起实现

懂球帝浏览 180 12-29

天溯计量夫妻控股近九成，税补占比高，逾期应收数千万元

权衡财经浏览 5976 07-29

曝辛巴出走香港被带走，面临多项指控，知情人曝问题性质很严重

扒虾侃娱浏览 361 09-06

车机升级第五代宏光MINIEV将于3月下旬上市

车质网浏览 108 03-17

比亚迪长城“交卷”，谁都不是“恒大”

字母榜浏览 367 09-02

一天两枚火箭发射失利中国航天科技集团发文回应

每日经济新闻浏览 188 01-19

其实，零百加速5秒的新规才是利好车企

速度计浏览 185 11-17

夫妻闪婚闪离后互相伤害女方找人男扮女装＂报复＂前夫

上观新闻浏览 729 09-11

阿维塔第21万辆正式下线

三言科技浏览 187 10-27

官方通报餐馆发蛤蟆汤照片拟罚45万:执法不当 5人停职

北京青年报浏览 1681 07-15

卫衣+半裙=早秋流行混搭套路，时髦极了！

Yuki女人故事浏览 270 09-20

业内人士：拟修订多晶硅单位产品综合能耗标准以推动落后产能出清

科创板日报浏览 1932 07-24

追梦21年奇瑞终上市，尹同跃身价直追王传福魏建军？

BT财经浏览 405 09-10

企业员工外派半月后轻生:家属质疑工作压力大企业否认

澎湃新闻浏览 564 08-11

特朗普没想到，忠心“小弟”要叛变

浏览 8062 07-14

收评：沪指涨超1%逼近4000点两市放量超3600亿

财联社浏览 247 10-28

马克龙宣布将正式承认巴勒斯坦国鲁比奥：美强烈反对

扬子晚报浏览 10799 07-26

31岁护士被同居男友杀害父亲：女儿之前从没谈过对象

环球网资讯浏览 2483 07-18

中俄互免签证，娶俄罗斯媳妇方便了，为何选择这个时机互免？

北向财经浏览 311 09-09

本站所有信息收集于互联网，如本站收集信息侵权，请联系我们及时删除
沪ICP备20017958号-11