主要观点:介绍了 Audiblez 工具,可将常规.epub 电子书生成.m4b 有声书,使用 Kokoro 的语音合成,支持多种语言和语音,有命令行工具和图形界面(GUI)两种使用方式,还可在 GPU 上运行,可手动选择章节转换等。
关键信息:
- 使用 Kokoro-82M 模型,约 82M 参数,自然输出,支持多种语言如英、法、日等。
- 命令行工具安装及使用方法,如在不同系统上安装依赖后通过
audiblez book.epub -v af_sky
转换。 - GUI 运行所需额外依赖及命令
audiblez-ui
。 - 在 Windows 上建议安装在 Python venv 中,包含 Cuda 支持的安装步骤。
- 可通过
-s
选项调整音频速度,范围 0.5 到 2.0。 - 可用语音及其对应的语言和性别,可通过
audiblez --help
查看帮助页面。 - 可通过
--cuda
在 GPU 上运行,暂不支持 Apple Silicon 。 - 可使用
--pick
手动选择章节转换。
重要细节: - 在 Google Colab 的 T4 GPU 上,将《动物庄园》(约 160,000 字符)转换为有声书约需 5 分钟,速率约 600 字符/秒;在 M2 MacBook Pro 上 CPU 转换约需 1 小时,速率约 60 字符/秒。
- 相关文章为Audiblez v4: Generate Audiobooks from E-books,作者为 Claudio Santini ,2025 年发布,遵循 MIT 许可。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。