F5-TTS：上海交大开源超逼真声音克隆 TTS-盘天下

F5-TTS：上海交大开源超逼真声音克隆 TTS

编程开发 2024-11-22 1137 0

F5-TTS：上海交大开源超逼真声音克隆 TTS

一款基于流匹配的全非自回归文本到语音转换系统，零样本，支持声音克隆、速度控制、控制语音情感表现、长文本合成、中英文多语言合成，并支持商用。

不需要复杂的设计如持续时间模型、文本编码器和音素对齐，能够快速训练并实现实时因素（RTF）0.15 的推理速度，显著优于当前基于扩散的 TTS 模型。

F5-TTS 在公共的 100K 小时多语言数据集上进行训练，展现出高自然性和表现力的零样本能力、无缝代码切换能力和速度控制效率。

开源地址：https:// github .com/SWivid/F5-TTS

转载请注明出处，本文链接：https://pantx.cn/14041.html

#f5tts #设计资源 #开源项目

(0)

1. 本站所有资源来源于网络，如有侵权请邮件联系站长！hygd0813@qq.com
2. 分享目的仅供大家学习和交流，您必须在下载后24小时内删除！
3. 不得使用于非法商业用途，不得违反国家法律。否则后果自负！
4. 本站提供的资源，都不包含版权，请大家谅解！
5. 如有链接无法下载、失效或广告，请联系管理员处理！
6. 本站资源售价只是赞助，收取费用仅维持本站的日常运营所需！

上一篇xiaomusic：使用 yt-dlp下载音乐并用小爱音箱播放开源项目

下一篇社群空间站9.9付费入群系统易支付版源码