Kokoro-TTS 82M轻量级TTS NAS部署

WFtEhH · 发表于 2026-5-18 15:57:52

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？立即注册

×

本帖最后由 WFtEhH 于 2026-5-18 16:10 编辑

1、简介
之前有一些项目或在做视频合成时需要用到tts（语音合成），不过之前买的minimax key自带的语音合成每天就几千个字，续费还不便宜。于是在网上翻了翻，还真让我找到一个好项目——kokoro-tts。项目地址：https://github.com/ardorleo/kokoro-tts-zh
Kokoro-tts只有82M参数，却能输出相当自然的中文语音；体积小巧到只需几百MB，却支持8种不同音色。更重要的是——它完全开源，Apache 2.0许可，零成本商用。

2、部署方法

services:
kokoro-tts:
image: ghcr.nju.edu.cn/remsky/kokoro-fastapi-cpu:latest
container_name: kokoro-tts
hostname: kokoro-tts
restart: unless-stopped
network_mode: bridge
ports:
- "8880:8880"
volumes:
- ./models:/app/models
environment:
- TZ=Asia/Shanghai

复制代码

部署的时候会自动下载几百兆的语音素材包，部署时会慢一些。
源用了国内加速镜像站，有条件可以直接用 image: ghcr.io/remsky/kokoro-fastapi-cpu:latest
3、使用方法
部署完直接http://NAS_IP:8880/web访问就行，实测合成后效果还是不错的，起码比浏览器自带的tts好太多了

4、其他
既然有kokorotts，顺便搜了下语音识别，也有一个轻量级的好项目vosk-api，有兴趣可以研究下项目地址：https://github.com/alphacep/vosk-api

[玩法教程] Kokoro-TTS 82M轻量级TTS NAS部署

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

评论