共计 1388 个字符,预计需要花费 4 分钟才能阅读完成。
我们先来听下效果,这是最近很火的ChatTTS项目,它是一款非常真实、自然、流畅的语音合成工具,它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练,支持上万种音色,支持音色克隆等功能。
本期视频就教大家如何在Unraid上面快速部署ChatTTS,自带WEBUI,无需显卡也可以使用,无需各类付费和有限制的软件,在本地就能合成语音了。
首先,我们在应用市场搜索安装docker compose manager,已经安装过的同学可以忽略。
安装完成后,点击设置,找到compse设置,把Compose Project Directory改到我们默认存放docker数据的路径:
/mnt/user/appdata
点击应用保存,这样可以方便我们对compose容器的安装和管理。
然后,打开unraid自带的web SSH终端工具,执行命令进入/mnt/user/appdata目录:
cd /mnt/user/appdata
执行拉取项目仓库命令:
git clone https://github.com/jianchang512/ChatTTS-ui.git chat-tts-ui
执行命令进入到项目目录:
cd chat-tts-ui
查看下目录内的文件:
ls
可以看到,这里面有docker-compose.cpu.yaml和docker-compose.gpu.yaml两个yaml配置文件,我这台机子没有显卡,我们就需要使用后缀为cpu.yaml配置文件。
执行下面命令将docker-compose.cpu.yaml文件名重命名为docker-compose.yml,就可以让unraid 的compose调用管理:
mv docker-compose.cpu.yaml docker-compose.yml
完成后回到unraid,点击docker,在最下面就可以看到我们刚创建的chat-tts-ui 的STACK堆栈了点击 COMPOSE UP启动,等待数据拉取和容器部署,这个窗口不要关闭,必须等待所有任务执行完成。
经过2分钟的等待,看到Container chat-tts-ui Started提示,就代表我们已经部署成功了。
在docker容器里可以看到容器的访问IP和端口,复制下来,就可以进行访问了。
软件具体用法呢,其实也很简单,web ui下的控制参数并不是很多,主要是需要找到自己喜欢的音色,然后在对其进行微调。下方提供了10000个中文音色包的下载地址,大家可以去下载使用。
10000个中文音色.zip下载地址:
链接:https://pan.quark.cn/s/03fcec7d6bf4
0.96版本后,因ChatTTS内核升级,已无法直接使用从该站点下载的pt文件:
https://modelscope.cn/studios/ttwwwaa/ChatTTS_Speaker
需要在容器的终端执行python cover-pt.py,此操作会把 speaker 目录下的,以 seed_ 开头,以 _emb.pt 结尾的文件,即下载后的默认文件名pt, 转换为可用的编码格式,转换后的pt将改名为以 _emb-covert.pt 结尾,转换完成后之前下载的_emb.pt 结尾的文件就可以删除了。
本教程配套操作视频: