MLX-Audio

MLX-Audio 是基于 Apple MLX 的音频框架,面向 Apple Silicon Mac。它将 VoxCPM 作为 TTS 后端之一,并提供 CLI、兼容 OpenAI 的 FastAPI 服务,以及独立的 Next.js Web 界面。

备注

若你想在 Apple Silicon Mac 上通过 MLX 栈运行 VoxCPM,且同时需要本地 API 服务或浏览器界面,这是较合适的选择。

支持的 VoxCPM 版本

VoxCPM 1.0(0.5B)

✅ 支持

VoxCPM 1.5

✅ 支持

VoxCPM 2

⚠️ 本页主要介绍 MLX-Audio 上当前的 VoxCPM 1.x 路径

准备工作

  • Apple Silicon Mac(M1 或更新)

  • Python 3.10+

  • 已安装 mlxmlx-audio

安装

pip install mlx-audio

或从源码安装:

git clone https://github.com/Blaizzy/mlx-audio.git
cd mlx-audio
pip install -e .

命令行用法

在命令行直接生成语音:

mlx_audio.tts.generate --text "Hello from MLX-Audio!" --model voxcpm

--model 可接受 voxcpm``(对应 VoxCPM 1.0)或 ``voxcpm1.5

API 服务

MLX-Audio 包含兼容 OpenAI 的 FastAPI 服务:

mlx_audio.server --model voxcpm

这会启动一个本地服务,可接收 /v1/audio/speech 请求,格式与 OpenAI TTS API 兼容。可将任意兼容 OpenAI 的客户端指向该服务。

网页界面

独立的 Next.js Web 界面位于 mlx_audio/ui/。搭建步骤见 MLX-Audio README

限制说明

  • MLX-Audio 尚未支持 VoxCPM 2。当前后端覆盖 VoxCPM 1.0 与 1.5。

  • 性能取决于你的 Apple Silicon 芯片。M1 Pro / M1 Max 及更新机型体验更佳。

  • MLX-Audio 由社区维护,与 OpenBMB 无官方隶属关系。