Python学习路线

2020-11-16
阅读 2 分钟
6.2k
经历长达近一个月的资源筛选过程终于结束,总共1.5T百度网盘的资源经过:去重、筛选、整理、归档之后一份粗略的Python学习曲线资源已经成型,虽然中间经历了很多坎坷,不过最终还是完成,猪哥也是第一时间与大家分享出来。

Python正则表达式,这一篇就够了!

2020-04-02
阅读 8 分钟
38.4k
大多数编程语言的正则表达式设计都师从Perl,所以语法基本相似,不同的是每种语言都有自己的函数去支持正则,今天我们就来学习 Python中关于 正则表达式的函数。re模块主要定义了9个常量、12个函数、1个异常,每个常量和函数猪哥都会通过实际代码案例讲解,让大家能更直观的了解其作用!

HTTP详解

2020-02-22
阅读 5 分钟
1.9k
爬虫又称网络爬虫,所以在讲解爬虫之前,我们有必要了解一下什么是网络?网络是由若干节点和连接这些节点的链路构成,然后网络与网络之间所串连成的庞大网络叫做互联网,而我们今天要讲的HTTP(HyperText Transfer Protocol 超文本传输协议)是互联网上应用最为广泛的一种网络协议,它是由万维网协会(World Wide Web Con...

正则表达式引擎执行原理——从未如此清晰!

2020-02-19
阅读 5 分钟
27.4k
目前越来越多的网站、编辑器、编程语言都已支持一种叫“正则表达式”的字符串查找“公式”,有过编程经验的同学都应该了解正则表达式(Regular Expression 简写regex)是什么东西,它是一种字符串匹配的模式(pattern),更像是一种逻辑公式。

破14亿,Python分析我国存在哪些人口危机!

2020-02-05
阅读 8 分钟
10.4k
2020年1月17日,国家统计局发布了 2019年国民经济报告 ,报告中指出:年末中国大陆总人口(包括31个省、自治区、直辖市和中国人民解放军现役军人,不包括香港、澳门特别行政区和台湾省以及海外华侨人数)140005万人。

Python如何实现微信群万人同步直播?

2019-12-16
阅读 5 分钟
6.6k
2019年7月微信对网页版微信进行了动态安全策略调整,导致一大批微信号不能登录网页版,但有些微信老号还是可以登录网页版的,具体哪些微信号可以登录哪些又不能登录,这个目前暂不了解!

JSON的使用场景及注意事项介绍

2019-11-29
阅读 6 分钟
5k
上篇我们讲解了JSON的诞生原因是因为XML整合到HTML中各个浏览器实现的细节不尽相同,所以道格拉斯·克罗克福特(Douglas Crockford) 和 奇普·莫宁斯达(Chip Morningstar)一起从JS的数据类型中提取了一个子集,作为新的数据交换格式,因为主流的浏览器使用了通用的JavaScript引擎组件,所以在解析这种新数据格式时就不...

JSON——IT技术人员都必须要了解的一种数据交换格式

2019-11-26
阅读 5 分钟
2.8k
JSON作为目前Web主流的数据交换格式,是每个IT技术人员都必须要了解的一种数据交换格式。尤其是在Ajax和REST技术的大行其道的当今,JSON无疑成为了数据交换格式的首选!

用Python分析淘宝2000款避孕套,得出这些有趣的结论

2019-09-18
阅读 6 分钟
2.5k
到现在为止,我们的淘宝教程已经写到了第四篇,前三篇分别是: 第一篇:Python模拟登录淘宝,详细讲解如何使用requests库登录淘宝pc端。 第二篇:淘宝自动登录2.0,新增Cookies序列化,教大家如何将cookies保存起来。 第三篇:Python爬取淘宝商品避孕套,教大家如何爬取淘宝pc端商品信息。 今天,我们来看看淘宝系列的第...

使用Python爬取淘宝两千款套套

2019-09-06
阅读 4 分钟
2.3k
顺便再提一下这个登录功能,代码是完全没有问题。如果你登录出现申请st码失败的错误时候,可以更换_verify_password方法中的所有请求参数。

淘宝自动登录2.0,新增Cookies序列化

2019-08-26
阅读 3 分钟
1.6k
前段时间时间为大家讲解了如何使用requests库模拟登录淘宝,而今天我们将对该功能进行丰富。所以我们把之前的那个版本定为1.0,而今天修改的版本定为2.0。版本的地跌意味着功能的升级,那今天的2.0版本较之前的1.0版本有哪些改进呢?我们一起来看看!

四六级成绩还可以这样查?Python助你装B一步到位!!!

2019-08-22
阅读 3 分钟
2k
昨天有很多同学在朋友圈秀六级成绩一个个都如(sang)此(jin)优(tian)秀(liang)当然也有悲催的哥们对于上面这位老弟我只能说:骚呢,兄弟这种事都能赶上,必须点赞

HTTP详解

2019-08-19
阅读 5 分钟
1.2k
爬虫又称网络爬虫,所以在讲解爬虫之前,我们有必要了解一下什么是网络?网络是由若干节点和连接这些节点的链路构成,然后网络与网络之间所串连成的庞大网络叫做互联网,而我们今天要讲的HTTP(HyperText Transfer Protocol 超文本传输协议)是互联网上应用最为广泛的一种网络协议,它是由万维网协会(World Wide Web Con...

Python模拟登录淘宝

2019-08-16
阅读 4 分钟
3.7k
最近想爬取淘宝的一些商品,但是发现如果要使用搜索等一些功能时基本都需要登录,所以就想出一篇模拟登录淘宝的文章!看了下网上有很多关于模拟登录淘宝,但是基本都是使用scrapy、pyppeteer、selenium等库来模拟登录,但是目前我们还没有讲到这些库,只讲了requests库,那我们今天就来使用requests库模拟登录淘宝!

七夕过后,你分析过自己单身原因的原因吗?

2019-08-08
阅读 3 分钟
1.2k
昨天的朋友圈都在丧心病狂的秀恩爱,秀520红包!于是就有人出来普法教育。。。可是很多老铁连发红包的机会都没有。。。为什么这么多如此优秀的同学都还是单身呢?

Python登录豆瓣并爬取影评

2019-08-05
阅读 4 分钟
2.5k
上一篇我们讲过Cookie相关的知识,了解到Cookie是为了交互式web而诞生的,它主要用于以下三个方面: 会话状态管理(如用户登录状态、购物车、游戏分数或其它需要记录的信息) 个性化设置(如用户自定义设置、主题等) 浏览器行为跟踪(如跟踪分析用户行为等) 我们今天就用requests库来登录豆瓣然后爬取影评为例子,用代...

爬取微博用户公开信息,分析为周杰伦打榜的夕阳红老年团,告诉你他们真实年龄!

2019-08-04
阅读 6 分钟
3.1k
前段时间为“周杰伦打榜”话题迅速登上微博热搜榜因为cxk的粉丝们质疑周杰伦微博没有数据(周杰伦没有开通微博)于是,无数隐匿江湖多年看不下去的周杰伦老年粉开始被迫营业于是一场周杰伦中老年粉VS蔡徐坤铁军微博打榜大战拉响为听了那么多年的周杰伦粉丝们纷纷拉下老脸和00后的微博饭圈小年轻们从零学习如何做数据