爬虫实现下载网页源码，css，js

thechosenone

86411326

发布于
2017-11-06

怎么用python实现爬虫实现下载网页源码，css，js文件，
就是把一些页面或者整个网站扒下来，自己断网都可以访问
用python实现

网页爬虫

python

阅读 6.3k

2 个回答

得票最新

藕丝空间

1.7k32438

发布于
2017-11-06

首先，希望你要爬取的网站的反爬虫技术比较落后，那么建议你看看这篇文章——使用 beautifulsoup 4 抓取网页内容实例。
其次，如果爬取的网站用的js技术比较多，那么建议你用 selenium2 + phantomjs。
.....
如果你想爬取淘宝之类的网站，我也不会，我曾经爬取过，用了第二种方法，就高兴了一分钟，然后就爬取不到了。如果你有结果，记得告诉我一声。

查看全部 2 个回答

推荐问题

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？
尝试一下字节的 trae AI IDE ([链接])安装后导入 vscode 的配置，好像一起把 vscode 的插件也导入了也能看到 vscode 之前配置的 ssh remote 但是连不上看到「输出」如下⬇️ {代码...}
2 回答5.3k 阅读✓ 已解决
DataCap 中验证码无法显示，后台出现 NullPointerException 错误?
2 回答1.2k 阅读✓ 已解决
发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？
发现深拷贝和浅拷贝效果一致： {代码...} 请问一下有什么区别呢？
4 回答1.6k 阅读✓ 已解决
如何实现一个深拷贝函数？
在项目开发中，如何实现一个深拷贝函数？
3 回答1.4k 阅读✓ 已解决
Python 成员变量在多个子类实例间共享，如何避免？
请教一下，Python版本为3.9.6，然后运行如下的代码，为什么会出现SlaveTwo类的对象modelTwo打印自身的成员变量storeDataArr的结果是['data1', 'data2']，不应该是['data2']？
3 回答1.4k 阅读✓ 已解决
分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？
分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？ {代码...}
2 回答971 阅读✓ 已解决
为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？
官方教程：[链接]且安装了最新的 modelscope 版本 {代码...} 运行官方文档中的 demo 代码 {代码...} 但是报错了 {代码...} 让我很是无语
1 回答1.8k 阅读✓ 已解决

相似问题

python 爬虫
1 回答1.9k 阅读
Python 爬虫
3 回答4.7k 阅读✓ 已解决
Python 爬虫 POST
2 回答5.6k 阅读
爬虫之Preview
2 回答2.6k 阅读
python selenium 爬虫
1.1k 阅读

找不到问题？创建新问题

爬虫实现下载网页源码，css，js

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。 请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？