python+Whisper+edge-tts搭建免费离线运行语音识别与文字转语音合成web api-BFW博客

python+Whisper+edge-tts搭建免费离线运行语音识别与文字转语音合成web api

python+Whisper+edge-tts库搭建免费可离线运行的语音识别与文字转语音合成http api服务

看了一下百度、讯飞、阿里等云服务器，语音识别和合成都是收费的，经济下行，还是自己搭建一个免费的语音识别与语音合成http api接口服务，配合阿里云的99元一年的云服务器不要太香了。

我们使用openai发布的 Whisper 进行语音识别，并结合微软的 edge-tts 实现文字转语音合成。这需要以下几个步骤：

1. 环境配置

安装必要的 Python 库，包括 Whisper 和 edge-tts，以及 Flask 作为 HTTP API 框架。

pip install flask openai-whisper edge-tts

2. Whisper 语音识别

Whisper 是 OpenAI 的一个语音识别模型，支持多语言的语音转文字功能。我们可以利用它的离线模型进行识别。

3. Edge-TTS 文字转语音合成

edge-tts 使用了微软的 Edge 浏览器的文字转语音技术，它支持多种语音和语言选择。该库也可以离线运行，适合本地化部署。

4. 创建 HTTP API 服务

以下是示例代码，将语音文件（如 .wav 文件）上传后调用 Whisper 进行语音识别，并使用 edge-tts 进行文字转语音合成，最终返回合成后的音频文件。

from flask import Flask, request, jsonify, send_file
import whisper
import edge_tts
import asyncio
import os

app = Flask(__name__)

# 加载 Whisper 模型
model = whisper.load_model("base")  # 使用 base 模型，你可以根据需求换成其他模型

# Whisper 语音识别功能
def transcribe_audio(audio_path):
    result ...

点击查看剩余70%

打赏博主×

python+Whisper+edge-tts搭建免费离线运行语音识别与文字转语音合成web api

1. 环境配置

2. Whisper 语音识别

3. Edge-TTS 文字转语音合成

4. 创建 HTTP API 服务

网友评论0

flex布局属性简介

ChatGPT官方发布最权威的164条prompt提示词指令大全

bfw平台是做什么的?

人工智能、机器学习和深度学习之间的区别

PHP8.1发布了十大特性你了解多少

shell脚本定时清除目录下的长时间未修改的目录或文件

python+ffmpeg+html手写一个ai故事短片儿童绘本漫画短视频制作神器

无需调用ai大模型api就能免费白嫖ai大模型开发中大型项目源码

使用阿里云函数计算fc作为代理访问海外网站技术教程及代码

这个世界是真实的吗？

{{item.title}}

Python3+Django配合Mongodb实现高性能可扩展标签云存储方案

win10下用python+openai打造一个ai语音交互助手

chatgpt的fine-tune微调与embedding操作入门

教你用python免费调用chatgpt4的api接口

用ChatGPT+LangChain做一个专属私有知识库问答系统

python多进程编程共享锁进程池队列通讯技术一览

python+Whisper+edge-tts搭建免费离线运行语音识别与文字转语音合成web api

用python+qwen自己写一个类似cursor帮你分析和修改整个项目目录源码的ai编程助手

python+deepseek v3实现类似cursor的目录源码ai编程助手

python+html5自己写了一个类似curosr的ai编程助手及目录代码编辑器

为啥ai生成视频模型只能5秒10秒或15秒生成，不能一次生成1分钟1i小时呢？

技术上如何解决被曝光的ai投毒geo行为？

有没有哪个大模型可以根据声音和文字描述生成带声音的视频？

如何实现华为手机终端设备之间隔空握拳抓取传送信息？

WinUI3和Electron有啥不同？

有哪些版权中心可以合作发布短剧漫剧进行赚钱？

ai装修解压视频提示词如何写？

有哪些视频钩子可以解决5s完播低问题？

seedance2如何根据一张九宫格分镜头图片生成ai视频短剧？

www.gstatic.com打开报错net::ERR_TUNNEL_CONNECTION_FAILED