用java爬取JavaScript动态生成的页面,怎么解析js?用rhino?phantomjs?还是其他的什么?
phantomJS可以。
除非是非常复杂的前端逻辑(比如说有一大堆逻辑去算token了) 否则不建议去模拟执行js他如果是动态加载的数据 直接拿json不是更简单
有解析js脚本的jar包,具体包记不清了。
就爬虫而言,直接模拟浏览器解析Javascript是不可取的。你可以直接抓取生成对应网页的json之类的来实现。
如果用java可以试一下Selinium的WebDriver,如果用js写那就直接phantomjs
参考下这个文档如何爬取JS动态生成的数据?http://doc.shenjianshou.cn/de...
8 回答6.5k 阅读
4 回答701 阅读✓ 已解决
2 回答3.4k 阅读
3 回答1.9k 阅读✓ 已解决
1 回答2.2k 阅读✓ 已解决
1 回答2.1k 阅读✓ 已解决
1 回答972 阅读✓ 已解决
1.2k 阅读
1 回答2k 阅读
861 阅读
4.2k 阅读
1 回答3.5k 阅读
phantomJS可以。