Unraid安装开源AI语音合成神器ChatTTS-ui教程

173次阅读
没有评论

共计 1388 个字符,预计需要花费 4 分钟才能阅读完成。

        我们先来听下效果,这是最近很火的ChatTTS项目,它是一款非常真实、自然、流畅的语音合成工具,它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练,支持上万种音色,支持音色克隆等功能。

         本期视频就教大家如何在Unraid上面快速部署ChatTTS,自带WEBUI,无需显卡也可以使用,无需各类付费和有限制的软件,在本地就能合成语音了。

        首先,我们在应用市场搜索安装docker compose manager,已经安装过的同学可以忽略。

        安装完成后,点击设置,找到compse设置,把Compose Project Directory改到我们默认存放docker数据的路径:

/mnt/user/appdata

点击应用保存,这样可以方便我们对compose容器的安装和管理。

然后,打开unraid自带的web SSH终端工具,执行命令进入/mnt/user/appdata目录:

cd /mnt/user/appdata

执行拉取项目仓库命令:

git clone https://github.com/jianchang512/ChatTTS-ui.git chat-tts-ui

执行命令进入到项目目录:

cd chat-tts-ui

查看下目录内的文件:

ls

        可以看到,这里面有docker-compose.cpu.yaml和docker-compose.gpu.yaml两个yaml配置文件,我这台机子没有显卡,我们就需要使用后缀为cpu.yaml配置文件。

        执行下面命令将docker-compose.cpu.yaml文件名重命名为docker-compose.yml,就可以让unraid 的compose调用管理:

mv docker-compose.cpu.yaml docker-compose.yml

        完成后回到unraid,点击docker,在最下面就可以看到我们刚创建的chat-tts-ui 的STACK堆栈了点击 COMPOSE UP启动,等待数据拉取和容器部署,这个窗口不要关闭,必须等待所有任务执行完成。

        经过2分钟的等待,看到Container chat-tts-ui Started提示,就代表我们已经部署成功了。

        在docker容器里可以看到容器的访问IP和端口,复制下来,就可以进行访问了。

        软件具体用法呢,其实也很简单,web ui下的控制参数并不是很多,主要是需要找到自己喜欢的音色,然后在对其进行微调。下方提供了10000个中文音色包的下载地址,大家可以去下载使用。

10000个中文音色.zip下载地址:

链接:https://pan.quark.cn/s/03fcec7d6bf4

 


0.96版本后,因ChatTTS内核升级,已无法直接使用从该站点下载的pt文件:

https://modelscope.cn/studios/ttwwwaa/ChatTTS_Speaker

        需要在容器的终端执行python cover-pt.py,此操作会把 speaker 目录下的,以 seed_ 开头,以 _emb.pt 结尾的文件,即下载后的默认文件名pt, 转换为可用的编码格式,转换后的pt将改名为以 _emb-covert.pt 结尾,转换完成后之前下载的_emb.pt 结尾的文件就可以删除了。


本教程配套操作视频:

正文完
 0
评论(没有评论)