tnblog
首页
视频
资源
登录

Whisper AI提词处理器

1505人阅读 2024/8/13 21:38 总访问:3475629 评论:0 收藏:0 手机
分类: python

Whisper AI提词处理器

Whisper简介


Whisper 是一种通用语音识别模型。
它基于大量多样化音频数据集进行训练,同时也是一种可以执行多语言语音识别、语音翻译和语言识别的多任务模型。

安装与应用Whisper


安装前提需要安装ffmpeg

  1. choco install ffmpeg


开始安装Whisper

  1. pip install -U openai-whisper


最好在安装之前开启代理进行安装。

  1. set HTTP_PROXY=socks5://127.0.0.1:10808
  2. set HTTPS_PROXY=socks5://127.0.0.1:10808


安装完成后我们可以通过whisper --help命令查看帮助。


这里的参数有很多,我们只需要使用到几个。
我这里以389479.mp3为例子。

  1. # 提取389479.mp3中的歌词,使用的是 small.en模型
  2. whisper 389479.mp3 --model small.en


我们发现会报错。
我在官网找到[Colab 示例],点进去。
https://github.com/openai/whisper


然后我们执行一下这一个


然后将我们的mp3文件进行上传。


添加我们的代码进行执行。

  1. !whisper 389479.mp3 --model small.en


我们可以看到转换成功了,将每一句歌词都分析了出来,并且保存为各种模式的文本文件。

但问题是它有下载模型,它的模型在哪儿呢?
它的模型在~/.cache/whisper/,我们将它复制到当前目录。


然后我们把模型进行下载。


保存到一个指定的目录中,然后在本地通过--model_dir参数指定模型路径。
再次执行,同样可以在本地进行题词了。

  1. whisper 389479.mp3 --model_dir D:\ai\music\MusicBot\MusicBot.ChatGPT\musicfile\model --model small.en

Whisper的模型列表


请根据自己的电脑配置进行选择,然后在https://huggingface.co/进行选择


欢迎加群讨论技术,1群:677373950(满了,可以加,但通过不了),2群:656732739

评价
这一世以无限游戏为使命!
排名
2
文章
636
粉丝
44
评论
93
docker中Sware集群与service
尘叶心繁 : 想学呀!我教你呀
一个bug让程序员走上法庭 索赔金额达400亿日元
叼着奶瓶逛酒吧 : 所以说做程序员也要懂点法律知识
.net core 塑形资源
剑轩 : 收藏收藏
映射AutoMapper
剑轩 : 好是好,这个对效率影响大不大哇,效率高不高
ASP.NET Core 服务注册生命周期
剑轩 : http://www.tnblog.net/aojiancc2/article/details/167
ICP备案 :渝ICP备18016597号-1
网站信息:2018-2025TNBLOG.NET
技术交流:群号656732739
联系我们:contact@tnblog.net
公网安备:50010702506256
欢迎加群交流技术