如何用爬虫爬去整个网站

normalHamal

发布于
2017-12-18

如题，如果我要爬取一个仅仅只是提供文档说明的网站，但它经常不稳定，所以我想把它整站下载下来方便以后查看。（注：希望提供下思路和方法，就是想顺便学习下）

node.js 网页爬虫静态网站

阅读 5.5k

2 个回答

发布于
2017-12-18

✓ 已被采纳

wget -r -p -np -k http://example.com/index.html

-r 递归
-p 下载页面相关的其它内容
-np 不追溯至父级
-k 页面内链接转换为相对链接

发布于
2017-12-18

直接用浏览器离线模式吧，没有必要写爬虫

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题