该项目实现了一个实时语音交互的数字人,支持多种语音方案,包括 GLM-4-Voice 和 ASR-LLM-TTS。用户可以根据需求自定义数字人的外观和声音,而无需进行训练,音色克隆功能让用户能够轻松创建个性化的语音体验。初始加载延迟低至 3 秒,适合各种应用场景。
开源地址:https:// github .com/Henry-23/VideoChat
该项目实现了一个实时语音交互的数字人,支持多种语音方案,包括 GLM-4-Voice 和 ASR-LLM-TTS。用户可以根据需求自定义数字人的外观和声音,而无需进行训练,音色克隆功能让用户能够轻松创建个性化的语音体验。初始加载延迟低至 3 秒,适合各种应用场景。
开源地址:https:// github .com/Henry-23/VideoChat
1. 本站所有资源来源于网络,如有侵权请邮件联系站长!hygd0813@qq.com 2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除! 3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负! 4. 本站提供的资源,都不包含版权,请大家谅解! 5. 如有链接无法下载、失效或广告,请联系管理员处理! 6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
本站为非经营类网站,资源全部来源于网络,不制作和存储任何资源,资源版权归原著作权人所有,请于下载后24小时内删除,如涉版权或其他问题请E-Mail联系,我们将及时撤销相应资源!
Copyright © 2024 盘天下 | 精选资源分享 冀ICP备2020025925号-1
页面耗时0.0654秒, 内存占用2.02 MB, 访问数据库57次
评论列表
发表评论