两个本地的视频和音频转文本AI工具软件：whisperdesktop和Buzz - 文章 - 开发者社区

之前的文章：《5个AI语音转文本工具评测，哪些免费又好用？》，对飞书妙记工具、网易见外、讯飞听见、钉钉闪记这5个AI语音转文本工具进行了评测，飞书妙记、钉钉闪记都表现不错。但是，这几个工具都是在线的，离网就用不了了。另外，虽然飞书妙记、钉钉闪记现在不收费，但是有一定的限制和额度。有没有一些本地安装的AI工具软件，既免费，又可以不依赖网络呢？

打造出ChatGPT的的人工智能公司 OpenAI ，开源了 Whisper 自动语音识别模型，能实现多种语言的转录，以及将这些语言翻译成英语。基于Whisper模型，whisperdesktop和Buzz这两款软件都实现了视频和音频转文本的功能。

●WhisperDesktop

要使用WhisperDesktop，首先要下载模型文件ggml-medium.bin，下载地址：

https://huggingface.co/datasets/ggerganov/whisper.cpp/blob/main/ggml-medium.bin，点击download

     ![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/8889b7c802664d659a1c47cf2bcdf330~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1781411123&x-signature=4PvvtQ%2FHLuuzjRUIn%2B5v7R0jT6E%3D)

然后打开软件，选择电脑中的模型保存地址

picture.image

接下来language这里选择视频或音频的语言种类，transcrib file选择视频或音频的具体地址，output format选择导出的格式，选择text files就可以了。如果要做视频字幕，可以选择subrip subtitles或者webvtt subtitles。然后点击transcrble就可以了。

picture.image