一个基于 OpenAI Whisper Large v3 (https://huggingface.co/openai/whisper-large-v3) 模型的高速音频转 文字 工具,能够在不到 98 秒的 时间 内转录 300 分钟(5 小时 )音频。
适用于多场景,支持 100 种 语言 的转录并支持翻译功能,提供按词或片段生成时间戳文本,方便字幕制作。
提供命令列界面(CLI),也可以通过 Whisper API 进行线上 语音转文字 。
开源地址:https:// github .com/Vaibhavs10/insanely- fast -whisper
评论列表
发表评论