Python爬虫实战,requests模块,Python实现告诉你女神节送什么礼物

Cooci

前言

利用Python实现告诉你女神节送什么礼物。废话不多说。

让我们愉快地开始吧~

开发工具

Python版本: 3.6.4

相关模块:

requests模块;

pandas模块

qrcode模块;

PIL模块;

以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量,pip安装需要的相关模块即可。

过女神节应该什么礼物好呢,爬取礼物说App,来告诉你选什么礼物好

App分析

爬取礼物TOP100榜单的信息

1.jpg

通过手机抓包软件「Charles」查找请求信息

2.jpg

成功发现请求信息

获取信息

代码实现

from copyheaders import headers_raw_to_dict
import requests
import json
import time

headers = b"""
Accept:text![]()ml,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8
Accept-Encoding:gzip, deflate, br
Accept-Language:zh-CN,zh;q=0.9
Cache-Control:max-age=0
Connection:keep-alive
Cookie:Hm_lvt_8a996f7888dea2ea6d5611cd24318338=1551961719; Hm_lpvt_8a996f7888dea2ea6d5611cd24318338=1551961719; session=c93470ef-86a2-43cc-abe3-36f98442bb8a
Host:api.liwushuo.com
Upgrade-Insecure-Requests:1
User-Agent:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36
"""
# 将请求头字符串转化为字典
headers = headers_raw_to_dict(headers)
num = 0

for i in range(0, 100, 20):
    time.sleep(5)
    # 请求网址
    url = 'https://api.liwushuo.com/v2/ranks_v3/ranks/2?limit=20&offset=' + str(i)
    response = requests.get(url=url, headers=headers)
    html = response.text
    # 将字符串转为json格式
    result = json.loads(html)
    # 礼物列表
    items = result['data']['items']
    for item in items:
        # 名称
        name = item['name']
        print(name)
        # 价格
        price = item['price']
        print(price)\
        # 礼物在礼物说里的地址
        url = item['url']
        print(url)
        # 礼物图片
        image = item['cover_image_url']
        print(image)
        # 礼物描述
        description = item['description'].replace(',', ',').replace('\n', '').strip()
        print(description)
        # 礼物淘宝购买地址
        purchase_url = item['purchase_url']
        print(purchase_url)
        # 礼物排行
        num += 1
        rank = 'TOP' + str(num)
        print(rank)
        print('\n')
        with open('gift.csv', 'a+') as f:
            f.write(name + ',' + price + ',' + url + ',' + image + ',' + description + ',' + purchase_url + ',' + rank + '\n')
        f.close()

成功获取礼物信息

3.jpg

礼物的名称、价格、图片链接、礼物说链接、介绍、淘宝链接以及排行信息

图片生成

1. 生成礼物图片

有了图片的链接,一会就下载下来了。

具体代码

import pandas as pd
import requests
import os

df = pd.read_csv('gift.csv', header=None, names=['name', 'price', 'url', 'image', 'description', 'purchase_url', 'rank'], encoding='gbk')

folder_path = "gift_image/"
os.makedirs(folder_path)

for j in range(100):
    url = df['image'][j]
    print(url)
    r = requests.get(url)
    picture_name = str(j+1) + '.jpg'
    with open('gift_image\\' + picture_name, 'wb') as f:
        f.write(r.content)

成功获取了礼物图片

4.jpg

本文源码详见个人主页简介获取

生成购买链接二维码

这里发现微信屏蔽了淘宝的二维码链接。

所以这里以礼物说链接来生成二维码。

可以一窥礼物的详细介绍。

具体的代码如下,使用了「qrcode」库。

import pandas as pd
import qrcode
import os

df = pd.read_csv('gift.csv', header=None, names=['name', 'price', 'url', 'image', 'description', 'purchase_url', 'rank'], encoding='gbk')

folder_path = "gift_buy/"
os.makedirs(folder_path)

for j in range(100):
    url = df['url'][j]
    print(url)
    img = qrcode.make(url)
    filename = "gift_buy/" + str(j+1) + '.png'
    img.save(filename)

成功生成100张二维码,图片就不展示了

阅读 95

Python实训营直播预约:[链接]

372 声望
36 粉丝
0 条评论

Python实训营直播预约:[链接]

372 声望
36 粉丝
文章目录
宣传栏