Parler TTS 是一个轻量级的开源高质量文本转语音 (TTS) 模型,可以以给定说话者的风格(性别、音调、说话风格等)生成高质量、 自然 流畅的语音。它是根据 Dan Lyth 和 Simon King 在 Stability AI 和 Edinburgh University 发表的论文《Natural language guidance of high-fidelity te x t-to-speech with synthetic annotations》的 工作 进行的复现,与其他 TTS 模型不同,Parler-TTS 是一个完全开源的发布版本,所有的数据集、预处理、训练代码和权重都以宽松的许可证公 开发 布,感兴趣的同学可以在线体验。
开源地址:https:// github .com/huggingface/parler-tts
评论列表
发表评论