如题,,,
想把转化后的html丢进nginx中, 请问如何转为html。。。。。。。
这个问题分两部分回答吧:
PDF 转 HTML;
PDF 和 HTML 结构差别极大,和epub比之HTML(epub只是HTML/XHTML的封装)
或者 Markdown 比之HTML(Markdown和HTML逻辑结构类似)有本质的区别。
目前有很多转换工具,可以用谷歌搜:PDF to HTML。需要注意的是,转换效果都不会很好。
Gitbook上的PDF文档是由其它格式转换而来的(默认Markdown)。即 Markdown -> PDF;
所以你可以尝试获取该PDF的Markdown源码,再转换成HTML。
建议选择这条路。
有个第三方python库可以很轻松解决这个问题,这个是项目的托管地址
[https://github.com/coolwanglu...
它的具体用法在这里
https://github.com/coolwanglu...
10 回答11.1k 阅读
6 回答3k 阅读
5 回答4.8k 阅读✓ 已解决
4 回答3.1k 阅读✓ 已解决
2 回答2.6k 阅读✓ 已解决
4 回答4.4k 阅读✓ 已解决
4 回答3.8k 阅读✓ 已解决
你不如使用pdf.js直接在网页里加载PDF