关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:013561人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

男子直播炫富称父母是东航招飞办负责人 曾为其破例招飞

潇湘晨报 浏览 9461 06-11

眼神防守!国足禁区里站8个人,被日本队远射破门 颜骏凌摊手抱怨

风过乡 浏览 2752 07-13

男孩大热天坐亲爸后妈后备厢数小时 亲妈已拿回抚养权

扬子晚报 浏览 4549 07-17

美联储降息如期而至,国际金价却大幅下跌,市场风向要变?

华夏时报 浏览 370 09-20

特斯拉Model Y L发布 六座布局33.9万元起

网易科技报道 浏览 470 08-19

销量、营收增长,净利润却下滑,江铃汽车增收不增利?

车宇世界 浏览 1330 07-24

刘浩存的天终于亮了,张艺谋当初真的没有骗我们

小先生笔记 浏览 482 09-29

奔驰部分车型指导价下调10%,两大行业组织曾发函:经销商库存过高、价格倒挂严重

红星资本局 浏览 271 02-04

今年冬天最流行搭配:裤子+靴子,高级又时髦!

LinkFashion 浏览 274 11-25

瑞幸咖啡,没有对手?| 业绩狂飙

伯虎财经 浏览 587 08-11

“反对者”鲍曼:敦促美联储9月降息,支持今年降息3次

华尔街见闻官方 浏览 4546 08-10

北约下周军演 将模拟可能动用核武器场景

界面新闻 浏览 376 10-12

2026年全明星球衣曝光!美国队两款+世界队一款:设计致敬洛杉矶

罗说NBA 浏览 273 02-04

林俊杰称心脏出问题 经纪公司回应

环球网资讯 浏览 10778 07-14

年度焦点!这是你从没见过的独特电影创作

幕味儿 浏览 288 12-15

蔡国强在海拔5500米喜马拉雅山脉放烟花引发争议

鲁中晨报 浏览 363 09-21

日企天空推出UMPC新品TENKU Pocket 8,搭载N305处理器

IT之家 浏览 274 02-24

提供两种动力系统 别克世家官方伪装照曝光

车质网 浏览 5076 07-01

半年销量过百万车企有7家了

朱伟华频道 浏览 4349 07-05

蜜雪冰城多地门店柠檬水断货 回应:将很快恢复供货

红星资本局 浏览 459 09-18

长安启源全新Q05官宣:新央企首款全球小型纯电SUV,头顶激光雷达

IT之家 浏览 6464 08-07
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11