头图

Ebook2Audiobook 是一款于 2024 年开源的工具,旨在将电子书 (eBooks) 转换为有声书 (audiobooks)。该项目利用先进的文本到语音 (Text-to-Speech, TTS) 技术,将电子书中的文本内容自动转换为语音,生成可供用户收听的有声书。Ebook2Audiobook 支持多种电子书格式,如 EPUB、PDF、MOBI 等,并能够保留章节结构和元数据,使生成的有声书更加易于导航和理解。

教程链接:https://go.openbayes.com/u90hh

使用云平台:OpenBayes
http://openbayes.com/console/signup?r=sony_0m6v

登录 http://OpenBayes.com,在「公共教程」页面,选择「Ebook2Audiobook 电子书转有声读物」教程。

图片

页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。

图片

选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。可以使用文章开头的邀请链接,获得 RTX 4090 使用时长!

图片

图片

稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。

图片

图片

进入 Demo 页面后,首先上传电子书文件(.epub, .mobi, .azw3, fb2, lrf, rb, snb, tcr, .pdf, .txt, .rtf, doc, .docx, .html, .odt, .azw)

图片

然后上传想要克隆的音色,此步可忽略,非必须上传文件。需要注意的是上传的文件要符合格式且时长不能超过 6 秒。

图片

之后选择显卡,建议选择 GPU,此步仅影响生成速度。

图片

选择电子书对应的生成语言,默认为英语。

图片

最后点击「Convert」生成。
(上传文件内容:当牵牛花初开的时节,葬礼的号角就已吹响。但是太阳,他每时每刻都是夕阳也都是旭日。当他熄灭着走下山去收尽苍凉惨照之际,正是他在另一面燃烧着爬上山巅布散烈朝晖之时。那一天,我也将沉静着走下山去,扶着我的拐杖。有一天,在某一处山洼里,势必会跑上来一个欢蹦的孩子,抱着他的玩具。当然,那不是我。但是,那不是我吗?)

图片

点击「Audio Generation Preferences」可设置生成参数。
生成参数

Temperature: 0.65。较高值生成更具创意和不可预测的输出,较低值使输出更单调。

Length Penalty: 惩罚较长序列。较高值生成较短的输出(不适用于自定义模型)。

Repetition Penalty: 惩罚重复短语。较高值减少重复。

Top-k Sampling: 较低值限制输出为更可能的单词,加快音频生成速度。

Top-p Sampling: 控制单词选择的累积概率。较低值使输出更可预测,加快音频生成速度。

Narrator Speed: 调整叙述者的语速。

Text Splitting: 将长文本拆分为句子以分块生成音频。适用于非常长的输入。

Enable Text Splitting: 启用文本拆分。

图片


小白狮ww
1 声望0 粉丝