用 AI 听书的时代来了！Ebook2Audiobook 一键电子书转有声书

Ebook2Audiobook 是一款于 2024 年开源的工具，旨在将电子书 (eBooks) 转换为有声书 (audiobooks)。该项目利用先进的文本到语音 (Text-to-Speech, TTS) 技术，将电子书中的文本内容自动转换为语音，生成可供用户收听的有声书。Ebook2Audiobook 支持多种电子书格式，如 EPUB、PDF、MOBI 等，并能够保留章节结构和元数据，使生成的有声书更加易于导航和理解。

教程链接：https://go.openbayes.com/u90hh

使用云平台：OpenBayes
http://openbayes.com/console/signup?r=sony_0m6v

页面跳转后，点击右上角「克隆」，将该教程克隆至自己的容器中。

选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像，OpenBayes 平台上线了新的计费方式，大家可以按照需求选择「按量付费」或「包日/周/月」，点击「继续执行」。可以使用文章开头的邀请链接，获得 RTX 4090 使用时长！

稍等片刻，待系统分配好资源，当状态变为「运行中」后，点击「API 地址」边上的跳转箭头，即可跳转至 Demo 页面。

进入 Demo 页面后，首先上传电子书文件(.epub, .mobi, .azw3, fb2, lrf, rb, snb, tcr, .pdf, .txt, .rtf, doc, .docx, .html, .odt, .azw)

然后上传想要克隆的音色，此步可忽略，非必须上传文件。需要注意的是上传的文件要符合格式且时长不能超过 6 秒。

之后选择显卡，建议选择 GPU，此步仅影响生成速度。

选择电子书对应的生成语言，默认为英语。

最后点击「Convert」生成。
(上传文件内容：当牵牛花初开的时节，葬礼的号角就已吹响。但是太阳，他每时每刻都是夕阳也都是旭日。当他熄灭着走下山去收尽苍凉惨照之际，正是他在另一面燃烧着爬上山巅布散烈朝晖之时。那一天，我也将沉静着走下山去，扶着我的拐杖。有一天，在某一处山洼里，势必会跑上来一个欢蹦的孩子，抱着他的玩具。当然，那不是我。但是，那不是我吗？）

点击「Audio Generation Preferences」可设置生成参数。
生成参数

Temperature: 0.65。较高值生成更具创意和不可预测的输出，较低值使输出更单调。

Length Penalty: 惩罚较长序列。较高值生成较短的输出（不适用于自定义模型）。

Repetition Penalty: 惩罚重复短语。较高值减少重复。

Top-k Sampling: 较低值限制输出为更可能的单词，加快音频生成速度。

Top-p Sampling: 控制单词选择的累积概率。较低值使输出更可预测，加快音频生成速度。

Narrator Speed: 调整叙述者的语速。

Text Splitting: 将长文本拆分为句子以分块生成音频。适用于非常长的输入。

Enable Text Splitting: 启用文本拆分。

用 AI 听书的时代来了！Ebook2Audiobook 一键电子书转有声书

小白狮ww

引用和评论

VASP 教程：VASP 结合 phonopy 计算硅的声子谱

人工智能与机器学习入门：基尼系数（Gini Index）和基于熵（Entropy）

Open WebUI：开源AI交互平台的全面解析

大模型中的Token究竟是什么？从原理到作用深度解析

被 Manus 带火的 MCP 是什么｜一文看懂

一文掌握 MCP 上下文协议：从理论到实践

人工智能与机器学习入门：决策树应用