Ebook2Audiobook 是一款于 2024 年开源的工具,旨在将电子书 (eBooks) 转换为有声书 (audiobooks)。该项目利用先进的文本到语音 (Text-to-Speech, TTS) 技术,将电子书中的文本内容自动转换为语音,生成可供用户收听的有声书。Ebook2Audiobook 支持多种电子书格式,如 EPUB、PDF、MOBI 等,并能够保留章节结构和元数据,使生成的有声书更加易于导航和理解。
教程链接:https://go.openbayes.com/u90hh
使用云平台:OpenBayes
http://openbayes.com/console/signup?r=sony_0m6v
登录 http://OpenBayes.com,在「公共教程」页面,选择「Ebook2Audiobook 电子书转有声读物」教程。
页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。
选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。可以使用文章开头的邀请链接,获得 RTX 4090 使用时长!
稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。
进入 Demo 页面后,首先上传电子书文件(.epub, .mobi, .azw3, fb2, lrf, rb, snb, tcr, .pdf, .txt, .rtf, doc, .docx, .html, .odt, .azw)
然后上传想要克隆的音色,此步可忽略,非必须上传文件。需要注意的是上传的文件要符合格式且时长不能超过 6 秒。
之后选择显卡,建议选择 GPU,此步仅影响生成速度。
选择电子书对应的生成语言,默认为英语。
最后点击「Convert」生成。
(上传文件内容:当牵牛花初开的时节,葬礼的号角就已吹响。但是太阳,他每时每刻都是夕阳也都是旭日。当他熄灭着走下山去收尽苍凉惨照之际,正是他在另一面燃烧着爬上山巅布散烈朝晖之时。那一天,我也将沉静着走下山去,扶着我的拐杖。有一天,在某一处山洼里,势必会跑上来一个欢蹦的孩子,抱着他的玩具。当然,那不是我。但是,那不是我吗?)
点击「Audio Generation Preferences」可设置生成参数。
生成参数
Temperature: 0.65。较高值生成更具创意和不可预测的输出,较低值使输出更单调。
Length Penalty: 惩罚较长序列。较高值生成较短的输出(不适用于自定义模型)。
Repetition Penalty: 惩罚重复短语。较高值减少重复。
Top-k Sampling: 较低值限制输出为更可能的单词,加快音频生成速度。
Top-p Sampling: 控制单词选择的累积概率。较低值使输出更可预测,加快音频生成速度。
Narrator Speed: 调整叙述者的语速。
Text Splitting: 将长文本拆分为句子以分块生成音频。适用于非常长的输入。
Enable Text Splitting: 启用文本拆分。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。