java爬虫如何解析JavaScript

用java爬取JavaScript动态生成的页面,怎么解析js?用rhino?phantomjs?还是其他的什么?

阅读 8.7k
6 个回答

phantomJS可以。

除非是非常复杂的前端逻辑(比如说有一大堆逻辑去算token了) 否则不建议去模拟执行js
他如果是动态加载的数据 直接拿json不是更简单

有解析js脚本的jar包,具体包记不清了。

就爬虫而言,直接模拟浏览器解析Javascript是不可取的。你可以直接抓取生成对应网页的json之类的来实现。

如果用java可以试一下Selinium的WebDriver,如果用js写那就直接phantomjs

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题