一开始学爬虫,也打算借此完成自己备份之前QQ空间日志信息的目的。
参考了文章https://segmentfault.com/a/11...
但是发现QQ空间整个日志列表是内嵌在一个<iframe>
中的,其中的链接指向一个日志中转页面,直接打开后本无页面显示。
无法找到准确的url,所以觉得这个问题不是那么简单。
似乎还涉及到登陆等模仿用户行为的问题,希望做过这方面的大神指点一二,不甚感激。
一开始学爬虫,也打算借此完成自己备份之前QQ空间日志信息的目的。
参考了文章https://segmentfault.com/a/11...
但是发现QQ空间整个日志列表是内嵌在一个<iframe>
中的,其中的链接指向一个日志中转页面,直接打开后本无页面显示。
无法找到准确的url,所以觉得这个问题不是那么简单。
似乎还涉及到登陆等模仿用户行为的问题,希望做过这方面的大神指点一二,不甚感激。
8 回答4.8k 阅读✓ 已解决
6 回答3.5k 阅读✓ 已解决
5 回答2.9k 阅读✓ 已解决
5 回答6.4k 阅读✓ 已解决
4 回答2.3k 阅读✓ 已解决
5 回答1.3k 阅读✓ 已解决
4 回答2.8k 阅读✓ 已解决
我当时是使用的selenium+phantomjs来在iframe之间跳转。