关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:019684人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。


IT之家注意到,该工具还支持 GPU 加速,可以显著加快转写过程。对于用户来说,这一功能取代了对外部、多步骤转写过程的需求,将任务整合到一个高效的单命令行工作流程中。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

传OpenAI年化收入达120亿美元,ChatGPT周活跃用户达7亿

华尔街见闻官方 浏览 4727 07-31

看了这么多穿搭才知道,越简单越高级,选基础款才省时省力

静儿时尚达人 浏览 7354 07-16

稳稳的高息,心动

越女事务所 浏览 5242 07-24

从“陀枪师姐”到豪门太太:滕丽名两遇渣男被小三,今成人生赢家

娱乐白名单 浏览 7046 07-22

一觉醒来,整个世界都在做多中国

米筐投资 浏览 0 08-22

37岁阚清子官宣怀孕,自曝已胖了30斤

石场阿鑫 浏览 4344 07-24

考公想上岸,千万别报班

识局 浏览 1896 07-26

有研报称义乌稳定币交易"月流水破10亿美元" 记者调查

21世纪经济报道 浏览 218 07-09

日本前首相鸠山由纪夫出席中国阅兵被批评

北京日报 浏览 1 09-08

“阔腿裤”下岗了,今夏流行“瘦瘦裤”,120斤秒变90斤!

Yuki女人故事 浏览 7862 07-15

最新锐超绝的北美电影组合,即将首访北京!

幕味儿 浏览 7278 07-14

再现高速惊魂!迈腾汽车变速箱故障为何如此难缠?

正经社 浏览 3080 07-23

硬派越野还配远端屏 捷途纵横G700展前亮相

网易汽车 浏览 9442 04-23

特来电李剑波:以“四网融合”构建新能源重卡充电新生态

凤凰WEEKLY财经 浏览 5993 08-11

韩军时隔七年在军事分界线附近重启炮击训练

财联社 浏览 3153 04-23

理发店主阻拦城管撕广告 冲突中被1名胖城管咬伤手指

大风新闻 浏览 0 09-29

微软新款13英寸Surface Laptop和12英寸Surface Pro上市:国补5511元起

超能网 浏览 7099 07-15

杀入50万级市场,极氪拼命向上

网易汽车 浏览 1 10-01

液冷概念爆发,市场空间将超1500亿!多家A股公司有望受益!

私募排排网 浏览 6786 08-18

英格兰顶级联赛参赛时长:利物浦111赛季20冠,曼联101赛季20冠

直播吧 浏览 0 08-23

泽连斯基:愿与特朗普和普京会面 但不去莫斯科

极目新闻 浏览 1 09-18
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2