关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:019702人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。


IT之家注意到,该工具还支持 GPU 加速,可以显著加快转写过程。对于用户来说,这一功能取代了对外部、多步骤转写过程的需求,将任务整合到一个高效的单命令行工作流程中。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

上海首批!小马智行获准于中心城区开展示范运营

财经众议院 浏览 8370 07-27

妻儿三人被丈夫发小杀害:空调开16℃ 地上没有血迹

红星新闻 浏览 20 12-23

进入冲刺时刻,“北方第三城”离上位有多远?

杠杆游戏 浏览 413 07-30

牛弹琴:特朗普现在很头疼 俄乌说一套做一套让他愤怒

大象新闻 浏览 16 08-23

引领效率革命、深挖万亿红利,京东工业的价值逻辑

尺度商业 浏览 15 12-12

罗体:罗马主帅不满本场热身赛表现,接球失误&横传太多&逼抢不足

直播吧 浏览 5279 07-27

《东极岛》首波口碑崩了!剧情翻车给英军战俘加高光,被吐槽崇洋

萌神木木 浏览 1142 08-09

HWG!罗马诺:扎尼奥洛与加拉塔萨雷续约后,将外租乌迪内斯

直播吧 浏览 14 09-02

新增哨兵模式等,比亚迪腾势 N8 迎来 OTA 升级

IT之家 浏览 6556 08-10

从问界M8到坦克500,这六款国产“黑马”车型,到底做对了什么?

车域无疆 浏览 17 09-01

单日票房携手破亿,《南京照相馆》和《浪浪山小妖怪》赢在了哪?

电和影 浏览 166 08-12

加拿大取消部分对美报复性关税后,加美官员将举行会晤

华尔街见闻官方 浏览 15 08-26

国产算力占比超 90%,中国联通近 80 亿元采购通用服务器

IT之家 浏览 3126 07-28

45岁的高圆圆生图美过精修,女神回春的秘密原来在这

黎贝卡的异想世界 浏览 7080 05-22

女子取240万现金"给外甥当彩礼" 外甥:根本没有对象

环球网资讯 浏览 13 01-09

奇才120-103尼克斯,巴格利18+11,亚布塞莱11分,克拉克森12分

懂球帝 浏览 15 10-14

苹果明年iPhone折叠屏手机被曝全面采用eSIM、TouchID而非Face ID

IT之家 浏览 19 08-25

特朗普威胁"美军轰炸会更猛烈" 伊朗:美国会后悔的

每日经济新闻 浏览 16 05-09

“消失”半年,一回归还是顶流,张颂文的新身份,再让人刮目相看

新语爱八卦 浏览 7972 07-11

海南封关首日:30克金饰省近万元 居民排长队买榴莲

极目新闻 浏览 14 12-21

透露动态!陈梦备战全运会即将回归赛场,坦言自己是ESFP人格

乒谈 浏览 9607 07-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2