关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:013566人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

日航万米急降乘客发声:获赔750余元

大象新闻 浏览 4486 07-03

帽子戏法,梅西当选阿根廷3-0阿尔及利亚一役本场最佳球员

懂球帝 浏览 15 06-17

很运动 全新雷克萨斯ES F SPORT渲染图曝光

车质网 浏览 402 09-28

金价上涨创5周新高,下半年还能买金吗?

国是直通车 浏览 7359 07-25

美国政府裁员太狠,关键能源报告发布推迟,另有重磅报告暂停发布

华尔街见闻官方 浏览 510 08-29

俄国防部高官住所搜出5亿卢布财产 被要求充公

红星新闻 浏览 437 08-29

小S复出获奖细节:纹了大S名字还带了骨灰

萌神木木 浏览 377 10-18

终于有女明星,为她发声了

独立鱼 浏览 282 12-21

10亿天价挖角惨遭12人连环拒,小扎钞能力失灵!OpenAI系初创0人卖身

新智元 浏览 5733 07-30

独生女拒绝接班!天津富豪套现7.2亿,把30年的家业卖给了国资

壹只灰鸽子 浏览 553 08-20

曝白百何资源受影响!好友还在嘴硬,多位业内下场内涵:太任性了

萌神木木 浏览 306 11-12

71岁赵雅芝近照曝光!一口白牙美到不敢认,至少年轻了30岁

温柔娱公子 浏览 410 10-01

注册资本200亿 新央企中国长安汽车集团成立

界面新闻 浏览 6266 07-29

理想i6不搞虚的,9月26日上市/第二天开始交付

星星car 浏览 402 09-20

多地将从今秋起试行中小学“春秋假”

澎湃新闻 浏览 416 09-19

黄仁勋:任何轻视华为、轻视中国制造能力的人,都极其天真!

深蓝财经 浏览 4962 07-17

吴磊起诉白珊珊诽谤,白珊珊称被盗号

芊手若 浏览 292 01-20

44岁李小璐参加公开活动!怼脸拍真实状态曝光,网友态度两极分化

萌神木木 浏览 332 10-14

预售22万元起 全新岚图知音将于8月28日上市

网易汽车 浏览 538 08-21

罗马诺:阿贾克斯即将与富安健洋签约半年,根据表现可能续约

懂球帝 浏览 326 12-11

美国空军因反对意见 降低对军靴高度要求:从8英寸降到6英寸

环球网资讯 浏览 475 09-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11