关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:019699人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。


IT之家注意到,该工具还支持 GPU 加速,可以显著加快转写过程。对于用户来说,这一功能取代了对外部、多步骤转写过程的需求,将任务整合到一个高效的单命令行工作流程中。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

但斌二季度美股持仓出炉!首次买入数字货币概念股!

私募排排网 浏览 4665 07-30

黑长直刘亦菲,今夕是何年?

时尚COSMO 浏览 9656 05-26

何小鹏给车企转型泼冷水:并非都能顺利成为人形机器人企业

快科技 浏览 5 03-11

中电港:公司是英伟达中国分销商之一

证券时报 浏览 8970 07-19

当AI具备“望、闻、问、切”,3分钟完成问诊

钛媒体APP 浏览 643 07-27

女子被判向出轨丈夫公开道歉15天 道歉视频引万人围观

大风新闻 浏览 7 01-16

第五届意大利繁花电影节圆满落幕!

幕味儿 浏览 9 10-25

布坎南:我正在努力回到巅峰,期待随黄潜在欧冠取得佳绩

直播吧 浏览 7909 07-31

王晓晨在网上维护俞灏明,眼里容不得一点黑评!

猛哥的搞笑视频 浏览 3254 07-30

太坑了!外卖平台AI商家泛滥,4招教你识破“幽灵外卖”真身

雷科技 浏览 2263 07-26

朝鲜公布驱逐舰"下水事故"最新进展:又拘留3名责任人

央视新闻客户端 浏览 6671 05-25

全球首个机器人6S店深圳开业 开启产业生态新篇章

新华社 浏览 4531 07-29

齐沃:我看到了一些积极的迹象,夏训时间很短但国米能做好准备

直播吧 浏览 6754 08-13

福特总部70年来首次搬家

MOTO 浏览 13 09-17

电讯报:热刺可能再次报价格伊,也在关注扎巴尔尼

懂球帝 浏览 1840 07-22

穆帅:违反财政的队该被扣分!法律上讲,我们应拿17-18赛季冠军

直播吧 浏览 9655 07-23

张雨绮新恋情?这一次没人劝得了她

振华观史 浏览 7129 08-13

美伊26日谈判在即 是否对伊朗动武:白宫先内讧了

每日经济新闻 浏览 6 02-24

世界杯摘金之后,“加速进化”要把机器人打造得跟个人电脑一样可靠又便宜

红星资本局 浏览 6816 08-10

美国务院宣布暂缓加沙个人访客签证发放

国际在线 浏览 9887 08-17

当海外Tier 1开始讲中国故事

远川科技评论 浏览 4885 07-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2