关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:013567人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

张家界司机突发疾病去世 晕倒前救下整车11名韩国游客

鲁中晨报 浏览 3281 07-11

云海肴创始人遗体告别仪式举行 好友:他患有焦虑症

鲁中晨报 浏览 503 09-21

哈马斯提出停火要求 承诺将撤离并保证被扣押人员安全

界面新闻 浏览 453 08-15

董袭莹事件后 中日友好医院谈医德建设

界面新闻 浏览 4953 07-03

特朗普在AI峰会上再表态:我们与中国"相处得很好"

环球网资讯 浏览 2545 07-25

农夫山泉,重上5000亿

21财闻汇 浏览 5334 07-29

郑州方特跳楼机载客高空悬停七八分钟 工作人员回应

极目新闻 浏览 501 10-02

大连海鲜成双十一最热销特产之一 海参大虾扇贝备受追捧

半岛晨报 浏览 311 11-10

苹果计划在明年 3 月推出全新改版 Siri “借鉴” Gemini 技术

威锋网 浏览 323 11-04

宇树科技新专利:利用数字孪生技术让 AI 机器人舞姿更灵动

IT之家 浏览 456 09-02

宗馥莉将独立经营“娃小宗” 名下仍关联超200家企业

21世纪经济报道 浏览 368 10-11

特朗普让美前高官带话到北京 他明白中美不能发生冲突

科技有趣事 浏览 505 09-20

特朗普:达不成协议 哈马斯将遭“彻底消灭”

环球时报新闻 浏览 364 10-07

伊朗官员发表"微型无人机袭击特朗普"言论 特朗普回应

环球网资讯 浏览 9815 07-11

歼20战机静态首展 隐形战机这次不“隐形”了

看看新闻Knews 浏览 328 09-19

奥运"双冠王"达尔迈尔在巴基斯坦登山时遇难 年仅31岁

极目新闻 浏览 7402 07-31

男子劫持飞机在机场盘旋约25分钟 F-15出动拦截

看看新闻Knews 浏览 2181 07-18

海航创始人陈峰,有期徒刑12年

财视传播 浏览 3088 07-18

陈奕迅自曝压力太大患焦虑症

大象新闻 浏览 2099 08-06

我国火箭院建成大型洁净气浮微重力实验室

IT之家 浏览 3131 07-17

2026年商品消费扩容升级 电商平台在行动

北京商报 浏览 285 01-12
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11