返回列表 发布新帖

[玩法教程] Kokoro-TTS 82M轻量级TTS NAS部署

207 0
发表于 2026-5-18 15:57:52 | 查看全部 阅读模式 IP:–河南 /全省通用

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
本帖最后由 WFtEhH 于 2026-5-18 16:10 编辑

1、简介
之前有一些项目或在做视频合成时需要用到tts(语音合成),不过之前买的minimax key自带的语音合成每天就几千个字,续费还不便宜。于是在网上翻了翻,还真让我找到一个好项目——kokoro-tts。项目地址:https://github.com/ardorleo/kokoro-tts-zh
Kokoro-tts只有82M参数,却能输出相当自然的中文语音;体积小巧到只需几百MB,却支持8种不同音色。更重要的是——它完全开源,Apache 2.0许可,零成本商用。

2、部署方法
  1. services:
  2.   kokoro-tts:
  3.     image: ghcr.nju.edu.cn/remsky/kokoro-fastapi-cpu:latest
  4.     container_name: kokoro-tts
  5.     hostname: kokoro-tts
  6.     restart: unless-stopped
  7.     network_mode: bridge
  8.     ports:
  9.       - "8880:8880"
  10.     volumes:
  11.       - ./models:/app/models
  12.     environment:
  13.       - TZ=Asia/Shanghai
复制代码
部署的时候会自动下载几百兆的语音素材包,部署时会慢一些。
源用了国内加速镜像站,有条件可以直接用 image: ghcr.io/remsky/kokoro-fastapi-cpu:latest
3、使用方法
部署完直接http://NAS_IP:8880/web访问就行,实测合成后效果还是不错的,起码比浏览器自带的tts好太多了

4、其他
既然有kokorotts,顺便搜了下语音识别,也有一个轻量级的好项目vosk-api,有兴趣可以研究下  项目地址:https://github.com/alphacep/vosk-api




评论

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright © 2026 绿联NAS私有云社区 版权所有 All Rights Reserved. 粤公网安备44030002002555号| 粤ICP备12028978号
关灯 在本版发帖
联系技术支持
返回顶部
快速回复 返回顶部 返回列表