尝试用Python3爬取网页图片的过程记录

Github上有一个关于下载百度贴吧里的美女图片的练习题，最近正好在学爬虫相关的知识，拿来练练手。
这是我的目标网页。
最开始的时候我在网上找到一个类似的案例，代码如下图：
来自简书用户十年之前
稍作修改，运行之后得到七十多张图片，结果一看接近一半是用户头像～
方法太过简单粗暴，决定使用美丽的汤——BeautifulSoup重写一下（这汤真香）
观察了一下页面的源代码，发现所有用户发的图片都是class=“BDE_Image”的，这样就可以区分头像和帖子里的图片了，随便写写的代码：

from urllib.request import urlretrieve
from urllib.request import urlopen
from bs4 import BeautifulSoup

def get_image(url):
    html = urlopen(url).read().decode('utf-8')
    bsObj = BeautifulSoup(html, "lxml")
    myimg = bsObj.find_all('img', class_='BDE_Image')
    num = 1
    for img in myimg:
        link = img.get('src')
        pic_name = str(num) + '.jpg'
        urlretrieve(link, pic_name)
        print("Success!" + pic_name)
        num += 1

    return None

url = 'http://tieba.baidu.com/p/2166231880'
get_image(url)

这次得到了49张图片

下载的图片

代码上传到了我的Github

交流群：435414286

尝试用Python3爬取网页图片的过程记录

公子政

引用和评论

Django+React全栈开发：动态字段

怎么来爬取代理服务器ip地址？（python）

Anaconda安装教程以及Anaconda和pip配置国内镜像

如何减少跨团队交付摩擦？——基于 DevOps 与敏捷的最佳实践

Python 描述符

科学计算编程涉及到的技术栈简介

使用 chardet 判断文件编码需要注意的坑——过大的文件会导致高耗时