«

ChatTTS: 最棒的开源中文文本转语音TTS模型

Purecafe 发布于 2024-6-8 09:05   24 次阅读   Tools   


一款专门为对话场景设计的文本到语音TTS模型。

一、介绍

该模型经过超过10万小时的训练,公开版本在 HuggingFace 上提供了一个4万小时预训练的模型。

专为对话任务优化,能够支持多种说话人语音,中英文混合等。

模型还能够预测和控制细粒度的韵律特征,如笑声、停顿和插话等,还能进行更细粒度的调整,如语速、音调和情感等。

二、功能特性:

视频介绍: 见B站

用法:

import ChatTTS
from IPython.display import Audio

chat = ChatTTS.Chat()
chat.load_models(compile=False) # 设置为True以获得更快速度

texts = ["在这里输入你的文本",]

wavs = chat.infer(texts, use_decoder=True)

torchaudio.save("output1.wav", torch.from_numpy(wavs[0]), 24000)

三、网址

项目地址: https://github.com/2noise/ChatTTS
在线地址: https://huggingface.co/2Noise/ChatTTS

开源 TexttoSpeech ChatTTS 中文 模型


扫描二维码,在手机上阅读
版权所有:Hola Everyday
文章标题:ChatTTS: 最棒的开源中文文本转语音TTS模型
本站文章均为原创,未经授权请勿用于任何商业用途

推荐阅读: