GitHub - santinic/audiblez: 从电子书生成有声读物

主要观点:介绍了 Audiblez 工具,可将常规.epub 电子书生成.m4b 有声书,使用 Kokoro 的语音合成,支持多种语言和语音,有命令行工具和图形界面(GUI)两种使用方式,还可在 GPU 上运行,可手动选择章节转换等。
关键信息

  • 使用 Kokoro-82M 模型,约 82M 参数,自然输出,支持多种语言如英、法、日等。
  • 命令行工具安装及使用方法,如在不同系统上安装依赖后通过audiblez book.epub -v af_sky转换。
  • GUI 运行所需额外依赖及命令audiblez-ui
  • 在 Windows 上建议安装在 Python venv 中,包含 Cuda 支持的安装步骤。
  • 可通过-s选项调整音频速度,范围 0.5 到 2.0。
  • 可用语音及其对应的语言和性别,可通过audiblez --help查看帮助页面。
  • 可通过--cuda在 GPU 上运行,暂不支持 Apple Silicon 。
  • 可使用--pick手动选择章节转换。
    重要细节
  • 在 Google Colab 的 T4 GPU 上,将《动物庄园》(约 160,000 字符)转换为有声书约需 5 分钟,速率约 600 字符/秒;在 M2 MacBook Pro 上 CPU 转换约需 1 小时,速率约 60 字符/秒。
  • 相关文章为Audiblez v4: Generate Audiobooks from E-books,作者为 Claudio Santini ,2025 年发布,遵循 MIT 许可。
阅读 23
0 条评论