还没有副业？教你用Python写一个淘宝客发单机器人

写在前面：本文只讨论技术实现原理及引导教程，不广告，不推广。文章有点长，各位看官可以各取所需。
说起2020年的人们讨论最多的词汇，我觉得副业应该可以算一个。
年初的疫情把大家都锁在家里，好多人的收入都没有了保障。于是，副业成了刚需。一时间，朋友圈卖各种东西的朋友如雨后春笋般冒了出来——谁谁谁又通过副业赚了几万乃至几十万的消息此起彼伏。这你能受得了？反正我是受不了！卖东西我不会卖，但我能让你卖得更加自动化。

总结

本篇文章用Python实现了一个淘宝客微信机器人自动获取包含大额优惠券的推广购买链接，推广者将可以获取推广佣金。具体功能如下：

给机器人发送淘口令，机器人能自动获取对应的大额优惠券
给机器人发送想要购买的物品名称，机器人会自动搜索对应物品，并筛选出性价比最高（当然也是佣金相对最高的啦）的商品生成推广购买链接
附加功能：生成对应卖货平台（闲鱼、转转等）的商品描述，简化上架操作（把上一步拿到的信息套进模板即可）

涉及概念	概念内容
主要`Python`库	`itchat`、`Wechaty`
主要概念	`app`数据爬取、微信机器人

`app`数据爬取

疫情在家期间除了官方淘宝客平台，还接触过一些第三方平台，对各自的佣金比例及平台信誉有一定了解。有的有网页端和app端，有的只有app端，可惜的是，我选出来我觉得最好的那个只有app端。

于是，怎么爬取app内的数据？这当然难不倒程序员啦。

爬取前的准备

手机上的工具有限，使用体验不佳，很直接就能想到让手机上的数据通过电脑传输，只要经过电脑了，那事情就好办了。我们使用Fiddler来完成这个操作：

Fiddler是一个http协议调试代理工具，它能够记录并检查所有你的电脑和互联网之间的http通讯，设置断点，查看所有的“进出”Fiddler的数据

下面简单介绍一下这个工具的下载与配置，以下文字参考自：Python3,x：如何进行手机APP的数据爬取，感谢作者的分享。

`Fiddler`下载与配置

首先到官网下载，根据系统选择安装包，下载地址为：https://www.telerik.com/download/fiddler。安装过程很简单没有什么特别的，直接下一步就好。

安装好以后，需要设置以下几项：

设置允许抓取HTTPS信息包
菜单栏找到 Tools -> Options，然后在HTTPS的工具栏下勾选Decrpt HTTPS traffic，在新弹出的选项栏下勾选Ignore server certificate errors (unsafe)。这样，Fiddler就会抓取到HTTPS的信息包。
设置允许外部设备发送HTTP/HTTPS到Fiddler
在Connections选项栏下勾选Allow remote computers to connect，并记住上面的端口号8888，端口号后面会使用到。
重启下Fiddler

手机端设置

手机端的配置相对比较麻烦，不过也还好。我使用的苹果机，所以这里只介绍苹果机的配置。其他系统的手机可以直接在网上搜索教程，类似的教程非常多，这里就不细讲了。

设置手机和电脑在同一网络内
前面说到手机上的数据通过电脑来传输，基本前提就是需要手机跟电脑在同一网络内。如果家里有WIFI，则手机和电脑都连上这个WIFI，台式机没有无线网卡的话可以用网线连接到WIFI对应的路由器上；家里没有WIFI的话，可以用手机打开无线热点，电脑连上手机的热点也可以。
设置手机HTTP代理
先获取电脑的IP地址：
然后进入手机WIFI的设置界面，选择当前连接网络的更多信息，在苹果中是一个叹号。点击进入后你会在最下面看到HTTP代理的选项，选择点击进入，选择手动。进入后，填写上面记住的IP地址和端口号，确定保存：
下载并安装Fiddler安全证书
手机上打开Safari浏览器输入一个上面IP地址和端口号组成的url: http://192.168.2.107:8888。打开后你会看到如下的界面，然后点击FiddlerRoot certificate并允许下载Fiddler证书。
下载完成后到设置里安装证书：

至此，Fiddler的安装与配置就做好了。

开始爬取

获取请求

打开手机上对应的app，Fiddler随即出来很多条请求，根据url可以很容易找出我们想要的内容。

这些内容就是获取app上我们看到的信息的网络请求，所以只需要用代码实现这些请求即可获取app上的信息。

【本文来自微信公众号Titus的小宇宙，ID为TitusCosmos，转载请注明！】

【为了防止网上各种爬虫一通乱爬还故意删除原作者信息，故在文章中间加入作者信息，还望各位读者理解】

根据需求，我们依次找到了淘口令搜索物品、直接搜索物品、特定物品生成推广购买链接及淘口令这三种请求。

分析请求

来看一下这些请求的具体内容吧。

点击某个请求，再点击响应栏的JSON选项卡看到请求返回的信息是一组Json字符串：

下面分别是生成淘口令和链接的请求对应的Json：

可以清晰的看到对应物品的图片、价格、佣金和简单描述等相关信息，这也正是我们想要的。

以淘口令搜索物品为例，请求栏的Headers选项卡也有这个请求的详细请求头信息：

模拟请求

有了这些信息，我们可以很清晰的模拟发送请求，代码如下：

from urllib.parse import urlencode
import requests
import pprint

def analysis_keyword(keyword):
    headers = {
        'Host': 'proxy.guod********.com',
        'Content-Type': 'application/x-www-form-urlencoded',
        'x-appid': '1911140394',
        'Accept': '*/*',
        'x-agent': 'JellyBox/2.2.4 (iOS, iPhone 8 Plus, 13.3.1)',
        'x-token': '',
        'x-devid': 'DF3D1D14-3230-497E-811E-C4425521736F',
        'Accept-Language': 'zh-Hans-CN;q=1',
        'Accept-Encoding': 'gzip, deflate, br',
        'x-userid': '',
        'User-Agent': 'AffordablePig/2.2.4 (iPhone; iOS 13.3.1; Scale/3.00)',
        'Content-Length': '0',
        'x-nettype': 'WIFI',
        'x-platform': 'iOS',
        'x-devtype': 'UTDID',
        'Cookie': 'PHPSESSID={}',
        'Connection': 'keep-alive',
    }

    headers['x-token'] = ******
    headers['x-userid'] = ******
    headers['Cookie'].format('**************')

    encoded_keyword = urlencode(keyword)
    query_url = 'https://proxy.guod********.com/cate/search?q={}&sort=&coupon=false&type=2&page=1'.format(
                encoded_keyword)

    sess = requests.session()
    result = sess.post(query_url, headers=headers).json()
    pprint.pprint(result)
    return result
 
print(analysis_keyword('*****'))

运行以后获取的信息为：

太长了，就不全部贴出来了。是不是跟Fiddler上面的一样？其他请求也是类似的道理。但有时候需要按步骤进行每一个请求，因为它们是一环套一环的。

微信机器人

到这里，我们就应该能获取到上面所说的那些信息了，那怎么才能发送给微信呢？

实现微信控制的有很多库，我用过的有代表性的就是itchat和Wechaty，他们都可以实现微信登录及收发信息等微信操作，只不过实现的方式不同。我前面的文章已经多次介绍这两个库，这里不再赘述。

实现机器人的方式也很简单，用户将要查询的物品名称或者淘口令发送给机器人，如果是在群聊中则需要用户@机器人（需要通过@确认是查询命令），机器人就会自动相对应的推广物品信息。

为了让实现机器人的代码保持功能单一，我把所有查券的代码放在一个文件中。

通用查券代码

上面的代码能够得到商品的详细信息，但是不可能直接把那些东西给用户吧，所以需要整理成言简意赅的短消息。代码如下（虽然少有注释，但变量名就是注释 0.0），类似的代码作了删减：

# 获取关键信息
def gen_good_coupan_desc(result, uland_url):
    good_data = result['result'][0] # 这里的result就是上面得到的result
    good_name = good_data['goods_name']
    good_id = good_data['goods_id']
    good_url = 'https://detail.tmall.com/item.htm?id={}'.format(good_id)
    good_pre_price = good_data['attr_prime']
    good_cur_price = good_data['attr_price']
    attr_ratio = good_data['attr_ratio']
    coupon = good_data['coupon_explain'] if 'coupon_explain' in good_data else ''
    coupon_begin_date = good_data['coupon_begin'] if 'coupon_begin' in good_data else ''
    coupon_final_date = good_data['coupon_final'] if 'coupon_final' in good_data else ''
    coupon_start_fee = good_data['coupon_start_fee'] if 'coupon_start_fee' in good_data else ''
    coupon_saving_amount = good_data['coupon_amount'] if 'coupon_amount' in good_data \
        else '{:.2f}'.format(float(good_pre_price) - float(good_cur_price))
    price_info = '现价: {}, 实付价: {}'.format(good_pre_price, good_cur_price)
    coupon_info = ''
    if coupon_begin_date != '' and coupon_final_date != '':
        coupon_info = '优惠券有效期: {}-{}'.format(coupon_begin_date, coupon_final_date)
    good_image_url = good_data['goods_thumb']
    params = {
        'timestamp': str(time.time()).split('.')[0],
        'url': uland_url,
        'member_id': headers['x-userid'],
        'text': good_name,
        'logo': good_image_url,
        'goods_id': good_id,
        'attr_prime': str(good_pre_price),
        'attr_price': str(good_cur_price),
        'attr_ratio': str(attr_ratio)
    }
    return params, good_url, good_image_url, good_name, price_info, coupon_info

def get_uland_url(result):
    pass
    return # 返回优惠券链接

def gen_TKL(result):
    # 代码与获取商品详情类似，省去
    pass
    return # 返回推广淘口令

def gen_web_url(result):
    # 代码与获取商品详情类似，省去
    pass
    return # 返回推广链接

def get_good_desc(keyword):
    result = analysis_keyword(keyword)
    uland_url = get_uland_url(result)
    coupan_desc = gen_good_coupan_desc(result, uland_url)
    if isinstance(coupan_desc, str):
        continue
    params, good_url, good_image_url, good_name, price_info, coupon_info = coupan_desc
    my_tkl = gen_TKL(params)
    my_web = gen_web_url(params, my_tkl)
    # 生成回复文本
    reply_TKL = reply_head + '复制本信息至TB领取隐藏优惠券({})'.format(my_tkl)
    good_reply = [good_name, price_info, coupon_info, reply_TKL] if coupon_info != '' \
        else [good_name, price_info, reply_TKL]
    return '\n'.join(good_reply)
  
print(get_good_desc(result))

当给机器人发送淘口令₳hr6a****ZTy₳时，机器人的回复就会是：

******医用口罩一次性医疗口罩三层防护灭菌熔喷布夏天透气非外科
现价: 18.8, 实付价: 16.8
优惠券有效期: 20200908-20200913
复制本信息至TB领取隐藏优惠券(₴C9v3c****po₰)

好了，现在万事俱备，只欠东风。下面就看看怎么实现机器人。

`itchat`版本机器人代码

itchat我已经写过很多篇了，这里直接上代码：

# -*- coding=utf8 -*-
import itchat
from itchat.content import *

# 如果是好友发送的文本消息
@itchat.msg_register([TEXT])
def text_reply(msg):
    sender_id = msg['User']['UserName'] if 'UserName' in msg['User'] else 'filehelper'
    content = msg['Content']
    # 生成回复文本
    reply = get_good_desc(keyword)
    itchat.send_msg(reply, sender_id)

# 如果是群聊发送的文本消息
@itchat.msg_register([TEXT], isGroupChat=True)
def group_reply(msg):
    content = msg['Text']
    if msg['IsAt']: # 如果被@
        # 获取需要查询的信息（去掉消息文本中的@及@后面的符号）
        content = '\u2005'.join(content.split('\u2005')[1:]) if '\u2005' in content \
                    else ' '.join(content.split(' ')[1:])
        sender_id = msg['User']['UserName']
        # 生成回复文本
        reply = get_good_desc(keyword)
        itchat.send_msg(reply, sender_id)

if __name__ == '__main__':
    itchat.auto_login(hotReload=True)
    itchat.run()

`Wechaty`版本机器人代码

其实代码都差不多，只不过每个库有每个库不同的使用方式，废话不多说，Show the code：

from wechaty import Wechaty
from typing import Optional, Union, List
from wechaty_puppet import ScanStatus, MessageType
from wechaty.user import Message, Room
from wechaty import Friendship, FriendshipType, Contact
import asyncio

async def on_message(msg: Message):
    await msg.ready()
    from_contact = msg.talker()
    room = msg.room()
    # 如果是文本消息
    if msg.payload.type == MessageType.MESSAGE_TYPE_TEXT:
        # 而且发单机器人被@
        if wechaty_robot_id in msg.payload.mention_ids:
            content = msg.text()
            if room is None:
                # 如果是好友发送的消息则直接生成回复文本
                reply = get_good_desc(content)
                await from_contact.ready()
                from_contact.say(reply)
            else:
                # 如果是群聊消息处理被@的消息
                if '\u2005' in content: # 手机发的消息会有这个特殊符号
                    content = '\u2005'.join([item for item in content.split('\u2005') if not item.startswith('@')])
                else: # 电脑发的则是空格
                    content = ' '.join([item for item in content.split(' ') if not item.startswith('@')])
                reply = get_good_desc(content)
                await room.ready()
                room.say(reply)

async def bot_start():
    bot = Wechaty()
    # 把消息处理方法绑定到"message"事件上
    bot.on('message', on_message)
    await bot.start()

asyncio.run(bot_start())

效果演示

说了这么多，该上点实在的东西了，下面就是实际运行的效果图了（图有点长，可以快点拉...）：

附言

就我的感受而言，之所以很多人热衷于副业，还是因为没钱或者是不够有钱，毕竟这一届社畜压力实在太大。如果这篇文章能帮到你，给你带来不一样的点子，也算让我感到欣慰了。

最后，希望所有人都不用副业就可以生活的很美满。

后记

不管写什么，希望能跟更多人沟通，有问题或者需求随时欢迎交流。

我所有的项目源码都会放在下面的github仓库里面，有需要可以参考，有问题欢迎指正，谢谢！

https://github.com/TitusWongCN/

下面是我的公众号，有兴趣可以扫一下：

还没有副业？教你用Python写一个淘宝客发单机器人

总结

`app`数据爬取

爬取前的准备

`Fiddler`下载与配置

手机端设置

开始爬取

获取请求

分析请求

模拟请求

微信机器人

通用查券代码

`itchat`版本机器人代码

`Wechaty`版本机器人代码

效果演示

附言

后记

TitusWong

引用和评论

3分钟教你注册美区苹果账号 - 最新教程

如何减少跨团队交付摩擦？——基于 DevOps 与敏捷的最佳实践

oc与swift文件的相互调用方式——桥接

Anaconda安装教程以及Anaconda和pip配置国内镜像

大数据从业者必知必会的Hive SQL调优技巧

科学计算编程涉及到的技术栈简介

Python3 格式化时间（qbit）

还没有副业？教你用Python写一个淘宝客发单机器人

总结

app数据爬取

爬取前的准备

Fiddler下载与配置

手机端设置

开始爬取

获取请求

分析请求

模拟请求

微信机器人

通用查券代码

itchat版本机器人代码

Wechaty版本机器人代码

效果演示

附言

后记

TitusWong

引用和评论

3分钟教你注册美区苹果账号 - 最新教程

如何减少跨团队交付摩擦？——基于 DevOps 与敏捷的最佳实践

oc与swift文件的相互调用方式——桥接

Anaconda安装教程以及Anaconda和pip配置国内镜像

大数据从业者必知必会的Hive SQL调优技巧

科学计算编程涉及到的技术栈简介

Python3 格式化时间（qbit）

`app`数据爬取

`Fiddler`下载与配置

`itchat`版本机器人代码

`Wechaty`版本机器人代码