爬虫基础练习-python批量下载图片之达盖尔的旗帜

2017-02-22
阅读 2 分钟
14.6k
三个重点,我隐藏了1024的地址,本爬虫只适用于1024的抓取。每个帖子以帖子名为文件名新建一个文件并把帖子内图片保存下来。 url_start设置起始页 url_end设置结束页有问题的留言,我看到就会回复 1编码 2文章页链接匹配 3文件夹操作 {代码...}

爬虫基础练习—python爬虫下载豆瓣妹子图片

2017-02-15
阅读 1 分钟
6.1k
下载指定网站上的妹子图片,这里只抓了前100页的图片,可根据需要自己设置页数cat值为图片类型,大家可以自行更改cat值体验一下,有问题留言给我,看到就会解答2 = 大胸妹3 = 美腿控4 = 有颜值5 = 大杂烩6 = 小翘臀

爬虫基础练习一 爬取豆瓣电影TOP250

2017-01-19
阅读 2 分钟
7k
这是一个很好的新手练习项目,爬取豆瓣top250的电影,并分别记录排名、片名、导演、主演、评论等信息,保存在一个txt文档里。对新手来说,难点部分在于如何找到并成功跳转到下一页,并且在最后一页的时候识别出来并停止爬虫。