求问pdfjs原理？

发布于
2020-05-22

pdfjs可以解析pdf文件转成canvas图片。
前端读取pdf转成blob，pdfjs解析blob转成canvas，里面的canvas是怎么从blob拿到页面信息的？

阅读 4.7k

1 个回答

然后去远足

发布于
2020-05-22

PDF 格式是有标准的（Adobe 公司制定的，前后有 PDF/X、PDF/A、PDF/VT、PDF/E 等几个格式）。

有标准就好办了，按标准来说一个合法的 PDF 文件的头几个字节是啥啥信息，中间几个字节是啥啥信息，结尾几个字节是啥啥信息…… pdf.js 就是把 PDF 文件当二进制处理，按这个标准去读取每个部分的字节来解析。

你会发现它的源代码里就是各种 parser。

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题