原

Whisper AI提词处理器

3086人阅读 2024/8/13 21:38 总访问：4546862 评论：0 收藏：0 手机

分类: python

![](https://img.tnblog.net/arcimg/hb/1d9b624d54e5446b8b10505e3e8f596e.png)

<meta name='impact-site-verification' value='fa1aa124-2a1a-4ce4-a855-7d566efb6468'>

>#Whisper AI提词处理器
[TOC]

Whisper简介
------------

tn2>Whisper 是一种通用语音识别模型。
它基于大量多样化音频数据集进行训练，同时也是一种可以执行多语言语音识别、语音翻译和语言识别的多任务模型。

安装与应用Whisper
------------

tn2>安装前提需要安装`ffmpeg`。

```bash
choco install ffmpeg
```

tn2>开始安装Whisper

```bash
pip install -U openai-whisper
```

tn2>最好在安装之前开启代理进行安装。

```bash
set HTTP_PROXY=socks5://127.0.0.1:10808
set HTTPS_PROXY=socks5://127.0.0.1:10808
```

tn2>安装完成后我们可以通过`whisper --help`命令查看帮助。

![](https://img.tnblog.net/arcimg/hb/ec2046458c5b425d8519ec611ab98fd2.png)

tn2>这里的参数有很多，我们只需要使用到几个。
我这里以`389479.mp3`为例子。

```bash
# 提取389479.mp3中的歌词，使用的是 small.en模型
whisper 389479.mp3 --model small.en
```

![](https://img.tnblog.net/arcimg/hb/3a9dd505da6147dfbbab5d525ebc96da.png)

tn2>我们发现会报错。
我在官网找到[Colab 示例]，点进去。
https://github.com/openai/whisper

![](https://img.tnblog.net/arcimg/hb/d258506de5fc44aaa09e51396fec2686.png)

tn2>然后我们执行一下这一个

![](https://img.tnblog.net/arcimg/hb/f30f6ef3e3394fd0b8800c2f22dde4a7.png)

tn2>然后将我们的mp3文件进行上传。

![](https://img.tnblog.net/arcimg/hb/7bcb76ed9a2e4a92ba85cb80c8ec9a1e.png)

tn2>添加我们的代码进行执行。

```bash
!whisper 389479.mp3 --model small.en
```

![](https://img.tnblog.net/arcimg/hb/4c7c5d17e51d48398fe62a71bc72e94c.png)

![](https://img.tnblog.net/arcimg/hb/33ea975930fe498fbb90c1d8649b724d.png)

tn2>我们可以看到转换成功了，将每一句歌词都分析了出来,并且保存为各种模式的文本文件。

tn>但问题是它有下载模型，它的模型在哪儿呢？
它的模型在`~/.cache/whisper/`,我们将它复制到当前目录。

![](https://img.tnblog.net/arcimg/hb/9fd3ea127b91409dbbce37635060b58b.png)

tn2>然后我们把模型进行下载。

![](https://img.tnblog.net/arcimg/hb/922e1fad3bc347d2bfbd5d3f727518e5.png)

tn2>保存到一个指定的目录中，然后在本地通过`--model_dir`参数指定模型路径。
再次执行，同样可以在本地进行题词了。

```bash
whisper 389479.mp3 --model_dir D:\ai\music\MusicBot\MusicBot.ChatGPT\musicfile\model --model small.en
```

![](https://img.tnblog.net/arcimg/hb/2acb8f8305f8420eb1f983c7e784a60e.png)


Whisper的模型列表
------------

![](https://img.tnblog.net/arcimg/hb/708b48d9b8e74b2d961dbb75ddd82350.png)

tn2>请根据自己的电脑配置进行选择，然后在`https://huggingface.co/`进行选择

欢迎加群讨论技术，1群：677373950(满了，可以加，但通过不了)，2群：656732739

👈{{preArticle.title}}

👉{{nextArticle.title}}

评价

尘叶心简

十年进阶：从.NET程序员迈向嵌入式AI的AIOPS之旅

博主信息

排名

文章

粉丝

文章类别

.net后台框架 208篇

linux 18篇

linux中cve 1篇

windows中cve 0篇

资源分享 11篇

Win32 3篇

前端 28篇

传说中的c 5篇

Xamarin 9篇

docker 15篇

容器编排 107篇

grpc 4篇

Go 17篇

yaml模板 1篇

理论 2篇

Whisper AI提词处理器

{{titleitem}} {{titleitem}}

{{titleitem}} {{titleitem}}