Flash图书地址如下:
http://www.infineon.com/cms/en/product/promopages/Reference_book_IGBT_Modules/eBook/
这本书有HTML和Flash两个版本,但是Flash的公式显示要好些。网上虽然可以免费查阅,但不太方便,所以想把Flash的弄成PDF版的。
鼓捣了一下,获得的信息就是,但是直接GET什么都没有。
GET /cms/en/product/promopages/Reference_book_IGBT_Modules/eBook/files/assets/flash/pages/page0214.swf?rnd=6B9C70D63C9D11DFA0D46B6255D89593 HTTP/1.1\r\n
所以想请教一下如何抓取Flash的图书,谢谢!
firefox 抓包可以看到进而down 每一页对应的swf
swf转jpg后,swf底下的文字层就不见了,jpg合并为pdf,后再ocr,就会出现排版,文字层讹误的情况。
同问!