一款开源的高质量文本转语音工具,适用于 Windows 操作系统。它能够转换文本、PDF、EPUB 和 SRT 文件为多种 语言 的语音音频。除了基本的文本转语音功能,Pandrator 还支持语音克隆、LLM 基于文本的预处理以及直接将生成的字幕音频保存到视频文件的能力。它利用了 XTTS、Silero、VoiceCraft 等模型进行文本到语音转换和语音克隆,并通过 RVC_CLI 进行增强,以提高语音质量和克隆结果。同时,Pandrator 还集成了 Te x t Generation Webui 的 API,可用于基于本地 LLM 的文本预处理,为音频生成前提供广泛的文本操作。
开源地址:https:// github .com/lukaszliniewicz/Pandrator
评论列表
发表评论