TTS WebUI

VoxCPM 已作为可安装扩展集成到 TTS WebUI 中,提供基于浏览器的文本转语音界面。

备注

该扩展封装了官方 voxcpm Python 包。扩展自带的 README 仅为模板占位,详细用法请参阅 VoxCPM 与 TTS WebUI 的主文档。

支持的 VoxCPM 版本

VoxCPM 1.0 (0.5B)

✅ 默认(界面写死为 openbmb/VoxCPM-0.5B

VoxCPM 1.5

❌ 扩展界面中不可用(需修改源码)

VoxCPM 2

❌ 不支持

主要特性

  • 在 TTS WebUI 中新增 「Vox cpm」 标签页

  • 使用官方 voxcpm Python 包进行推理

  • 作为 TTS WebUI 扩展,安装简单

准备工作

安装

pip install git+https://github.com/rsxdalv/tts_webui_extension.vox_cpm@main

然后重启 TTS WebUI,界面中会出现 Vox cpm 标签页。

使用方式

  1. 在浏览器中打开 TTS WebUI

  2. 切换到 Vox cpm 标签页

  3. 输入文本并配置生成参数

  4. 点击生成以合成语音

开发场景:

cd tts_webui_extension/vox_cpm
python main.py