爬取某网站的公示信息,打开第一页(当月)后,底部的跳转是按月份。
每一个链接都有相似结构
<a href="/notices/2018/1">1月</a>
请问在scrapy中要如何爬取。
爬取某网站的公示信息,打开第一页(当月)后,底部的跳转是按月份。
每一个链接都有相似结构
<a href="/notices/2018/1">1月</a>
请问在scrapy中要如何爬取。
2 回答5.3k 阅读✓ 已解决
2 回答1.2k 阅读✓ 已解决
4 回答1.6k 阅读✓ 已解决
3 回答1.4k 阅读✓ 已解决
3 回答1.4k 阅读✓ 已解决
2 回答974 阅读✓ 已解决
1 回答1.8k 阅读✓ 已解决
你应该分析html结构和抓取的标签,例如这是一个table(我瞎猜的,嗯)tabody->tr->td->a,然后去使用xpath或者BeautifulSoup4去提取,提取出来的月份链接list,循环遍历这个list产生请求去追踪每个页面。