scrapy 如何抓js渲染出来的内容？

发布于
2016-12-30

更新于
2016-12-30

最近在写一个项目，要放到服务器上每天定时自己爬数据，然后放到数据库。在用scrapy抓的时候，发现js解析不了，查了文档，发现scrapy本身不能解析js。
然后查了一些模块，资料不多，也是一直半解。
现在需要解决以下几个问题：

1.可以在linux服务器上运行，不要再装个浏览器，然后通过打开浏览器解析。
2.如果能解决爬取时候阻塞问题更好。

另外相关的模块也查到了几个，但是搞不清用哪个能解决上面两个问题，麻烦各位求解。

python scrapy

阅读 5.8k

1 个回答

得票最新

oliver_lv

1.8k1112

发布于
2016-12-30

使用phantomjs。安装selenium模块，然后

from selenium import webdriver
driver = webdriver.PhantomJS() 
driver.get(url)

查看全部 1 个回答

推荐问题

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？
尝试一下字节的 trae AI IDE ([链接])安装后导入 vscode 的配置，好像一起把 vscode 的插件也导入了也能看到 vscode 之前配置的 ssh remote 但是连不上看到「输出」如下⬇️ {代码...}
2 回答5k 阅读✓ 已解决
DataCap 中验证码无法显示，后台出现 NullPointerException 错误?
2 回答1k 阅读✓ 已解决
发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？
发现深拷贝和浅拷贝效果一致： {代码...} 请问一下有什么区别呢？
4 回答931 阅读✓ 已解决
如何实现一个深拷贝函数？
在项目开发中，如何实现一个深拷贝函数？
3 回答1.1k 阅读✓ 已解决
Python 成员变量在多个子类实例间共享，如何避免？
请教一下，Python版本为3.9.6，然后运行如下的代码，为什么会出现SlaveTwo类的对象modelTwo打印自身的成员变量storeDataArr的结果是['data1', 'data2']，不应该是['data2']？
3 回答1.1k 阅读✓ 已解决
为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？
官方教程：[链接]且安装了最新的 modelscope 版本 {代码...} 运行官方文档中的 demo 代码 {代码...} 但是报错了 {代码...} 让我很是无语
1 回答1.7k 阅读✓ 已解决
Spark-TTS-0.5B 的 requirements.txt 在哪里？
[链接]我都真找不到这个 requirements.txt 文件在哪里
1 回答1.2k 阅读✓ 已解决

相似问题

scrapy 抓不到起始网页内容
3 回答6.5k 阅读✓ 已解决
scrapy抓取知网response的内容重复
3 回答4.9k 阅读
scrapy 抓取li标签下的内容为空？
1 回答5.8k 阅读
scrapy抓取内容保存为中文问题
3 回答7.7k 阅读✓ 已解决
scrapy 处理文章分页的内容
3 回答4.3k 阅读

找不到问题？创建新问题

scrapy 如何抓js渲染出来的内容？

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？