Python 你见过三行代码的爬虫吗

2020-05-20
阅读 2 分钟
181
Python 使用Lassie库,仅编写三行代码就能爬取静态页面上的图片和视频。Python实战教程每次讲爬虫的时候都会从“发送请求” 开始讲,讲到解析页面的时候可能大部分读者都会卡住,因为这部分确实需要一点XPATH或者CSS选择器的前置知识。那么有没有不需要这么复杂的操作就能把页面信息读取出来的方法呢?

Python 短文本自动识别个体是否有自杀倾向

2020-05-20
阅读 4 分钟
223
上一篇文章,我们以微博树洞为例,讲解了怎么自动爬取单个微博的评论。今天我们就要用上这些数据做一个自杀倾向分类器,这样的分类器如果应用得当,将可以帮助成千上万误入歧途的人们挽回生命。

Python 爬取“微博树洞”详细教程

2020-05-20
阅读 4 分钟
301
其实这样的数据是挺难找的,尤其是对于我这种需求量比较大的项目。不过好在最后发现了突破口:“微博树洞”。“微博树洞”是指宣告了自杀行为的过世的人的微博,其留言区成为成千上万的抑郁症或是绝望的人的归属,在其下方发布许多负能量甚至是寻死的宣言。

教你怎么用 Python 自动整理文件

2020-05-19
阅读 3 分钟
200
我经常习惯性地把下载下来的东西放在桌面或者下载文件夹中,使用完后再也没管它,久而久之桌面便变得乱七八糟,到后面再整理的时候就非常痛苦了,巴不得有一个自动整理的工具帮我归类文档。

Python 十个加快编程效率的技巧

2020-05-17
阅读 2 分钟
227
1.交换两个数字 {代码...} 输出 {代码...} 2.反转字符串 {代码...} 输出 {代码...} 3.连接列表中的元素 {代码...} 输出 {代码...} 4.多比较符 {代码...} 输出 {代码...} 5.输出模块的位置 {代码...} 输出 {代码...} 6.使用枚举 {代码...} 输出 {代码...} 7.函数返回多个值 {代码...} 输出 {代码...} 8.找到数组中出现频...

Python 超简单实现9种图像风格迁移

2020-05-16
阅读 4 分钟
194
Python 图像风格迁移已经属于比较成熟的领域了,现在连实时的风格迁移都不成问题。之前一直想出一篇这样的文章,但无奈于大部分开源项目配置起来非常麻烦,比如 luanfujun/deep-photo-styletransfer 项目,需要安装 CUDA、pytorch、cudnn等等,配置完一天都过去了。

Python 超简单实现人类面部情绪的识别

2020-05-16
阅读 2 分钟
223
还记得我们之前写过一篇文章《手把手教你人脸识别自动开机》吗?里面用OpenCV对人脸进行简单的识别,让计算机训练认识到某个特定人物后识别对象。今天来做点高级的,识别出人脸的情绪。

Python使用”先知”预测公众号未来的粉丝量

2020-05-16
阅读 3 分钟
192
最近公众号的粉丝量一直都处于上涨状态,可喜可贺,当然,作为一个上进的(摸鱼)公众号博主,当然要追求更远大的目标。我希望知道一个月后公众号的粉丝量会达到什么程度,并以此加强公众号的宣传方式。

Python 超简单爬取新浪微博数据 (高级版)

2020-05-16
阅读 3 分钟
476
新浪微博的数据可是非常有价值的,你可以拿来数据分析、拿来做网站、甚至是*。不过很多人由于技术限制,想要使用的时候只能使用复制粘贴这样的笨方法。没关系,现在就教大家如何批量爬取微博的数据,大大加快数据迁移速度!

Python 脚本自动窗口截图

2020-05-15
阅读 3 分钟
304
利用Python自带的win32api和win32con、win32gui等模块,我们能执行许多windows下的自动化操作。比如两个窗口的自动点击操作,从软件中的窗口复制文本到txt中,甚至是截图操作。

python 使用 Dis 模块进行代码性能剖析

2020-05-15
阅读 2 分钟
164
Python代码在执行的时候,会被编译为Python字节码,再由Python虚拟机执行Python字节码。有时候就我们执行python文件的时候会生成一个pyc文件,这个pyc文件即用于存储Python字节码指令,而这些字节码是一种类似于汇编指令的中间语言,但是每个字节码对应的不是机器指令,而是一段C代码。

Python使用“漫威API”探索漫威宇宙

2020-05-15
阅读 4 分钟
157
现在,我们有很好的库来帮助我们实现这些想法了!Marvel Comics API 允许各地的开发人员访问漫威70年来庞大的漫画库信息。接下来就来告诉大家怎么使用这个漫威库。

利用Python找出适合你的国考市考公务员岗位

2020-05-14
阅读 4 分钟
189
由于表格是Excel的xlsx格式,我们需要用到两个包,xlrd和xlwt,使用pip安装即可,如果你还没有安装Python和pip,请看这篇教程:安装Python. 在CMD/TERMINAL输入以下两条命令进行安装:

Python 超简单玩转微信自动回复

2020-05-14
阅读 2 分钟
458
注意:强烈建议仅使用小号运行机器人!从近期 (17年6月下旬) 反馈来看,使用机器人存在一定概率被限制登录的可能性。主要表现为无法登陆 Web 微信 (但不影响手机等其他平台)。

Python 超简单爬取微博热搜榜数据

2020-05-13
阅读 4 分钟
248
微博的热搜榜对于研究大众的流量有非常大的价值。今天的教程就来说说如何爬取微博的热搜榜。 热搜榜的链接是: [链接] 用浏览器浏览,发现在不登录的情况下也可以正常查看,那就简单多了。使用开发者工具(F12)查看页面逻辑,并拿到每条热搜的CSS位置,方法如下: 按照这个方法,拿到这个td标签的selector是: pl_top_rea...

Python生成器不该这么用

2020-05-13
阅读 1 分钟
145
最近在知乎上有人误解了Python生成器的使用,在这里我们来统一探讨下它这么用对不对。 举一个例子,编写一个函数计算一串数字里所有偶数的个数,其实是很简单的问题,但是有些人是用生成器这么写的: {代码...} 生成器这么用其实是速度最慢的一种做法,花费了52微秒。我们来看看如果我改成列表解析式会怎么样: {代码......

Python里Yield关键词的作用

2020-05-12
阅读 2 分钟
149
要理解yield的作用,您必须理解生成器是什么。在理解生成器之前,必须先理解迭代器。 迭代器 当您创建一个列表时,您可以逐个读取它的项。逐项读取其项称为迭代: {代码...} {代码...} mylist是一个可迭代的对象。当你使用列表解析式时,你创建了一个列表,因此也是一个迭代器: {代码...} {代码...} 所有你可以用"for... ...

学python都用来干嘛?

2020-05-12
阅读 1 分钟
352
我最近学python,不过不知道怎么练习,不知道用来写什么。大家都用来干嘛的?都说说python可以用来写什么好玩的东东。 能写的东西可太多了,日常生活的有这么些有趣的教程: 比如哄哄女朋友:Python 导出微信聊天记录 生成词云 向手机发送通知:Python 向手机发送通知(IFTTT) 文献搜索工具:python 超级文献搜索工具 制...

你应该用Python3.x而非Python2.x的20个理由

2020-05-12
阅读 2 分钟
150
最近小编在知乎上经常遇到这样的问题:《现在开始学习python的话,是学习python2.x还是学习python3.x比较好?》,这也是许多初学者会遇到的问题,我们的答案是python 3.x. 为了帮助大家消除疑惑,在这里统一告诉大家原因。

为什么Python这么适合AI和机器学习?4位专家给你答案

2020-05-10
阅读 3 分钟
411
Python是机器学习的最佳编程语言之一,其迅速地在学术界和相关研究领域威胁到甚至超过了R的主导地位。为什么Python在机器学习领域如此受欢迎呢?为什么Python对AI有好处?

准确率94%!Python 机器学习识别微博或推特机器人

2020-05-10
阅读 4 分钟
217
推特或微博机器人的存在其实是比较危险的,他们可以制造虚假的流量、传播谣言、甚至执行一些令人汗颜的恶意操作,这里我们使用kaggle纽约大学2017年机器学习竞赛的推特分类数据来进行我们的识别实验,本实验的数据集请访问:下载Python推特机器人分类数据集。

7行代码 Python热力图可视化分析缺失数据处理

2020-05-09
阅读 2 分钟
160
你有没有遇到一种情况,处理一张很大的csv表格的时候很难找到表格中每一列的缺失数据,或者说处理速度非常慢?当然如果你的Excel水平非常高,这个可能不会成为你的问题,但如果当你想可视化出每一列缺失数据的分布和数量怎么办呢?这时候就需要用Python绘制热力图了!

Python 监控Github项目更新并自动下载

2020-05-09
阅读 2 分钟
162
如果你有自己在本地维护一个开源代码库,你就会知道检测这些库是否更新了是多麻烦的一件事情。随着库的增大,人工维护成本也就越来越大。因此便有了这个项目的想法:让我们用Python监控Github项目是否有更新,如果有的话自动下载该更新!

让python运行地超快的10个方法

2020-05-08
阅读 4 分钟
167
大部门人使用python是因为它非常方便,而不是因为它速度快。过多的第三方库使得python相比于Java和C的性能差距较大。但也是可以理解的,因为在大部分情况下,开发速度优先于执行速度。

python 文件下载、大文件下载、异步批量下载 教程

2020-05-08
阅读 2 分钟
218
原文来自Python实用宝典:python 文件下载、大文件下载、异步批量下载 教程 按照不同的情况,Python下载文件可以分为三种: 小文件下载 大文件下载 批量下载 python 小文件下载 流程:使用request.get请求链接,返回的内容放置到变量r中,然后将r写入到你想放的地方。 以下载上述流程图为例子: 运行完毕后,它将会被保...

精美的数据分析图!教你使用Python的Plotly库

2020-05-07
阅读 3 分钟
309
plotly 是目前已知的Python最强绘图库,它比上次我们讲的echarts还强大许多许多,它的绘制通过生成一个web页面得到,而且支持调整图像大小后保存,而且还能支持可动态调节的页面,方便python web端的开发。

超简单Python安全批量打水印教程!

2020-05-07
阅读 3 分钟
415
原文来自Python实用宝典:超简单Python安全批量打水印教程! 工作的时候,尤其是自媒体,我们必备水印添加工具以保护我们的知识产权,网上有许多的在线/下载的水印添加工具,但他们或多或少都存在以下问题: 在线工具需要上传到对方服务器,信息不安全。 很多工具不具备批量处理功能。 很多工具自定义的功能太少,如水印...

Python七月超有用的十大开源代码(2019)

2020-05-06
阅读 3 分钟
156
Mybridge AI 将github上的每个Python项目根据分享总数,读取的分钟数等特征,并用他们的算法计算出了以下2019年7月的十大开源项目。这些项目可能对你的技术生涯会很有帮助。

你不得不知道的python超级文献搜索工具

2020-05-06
阅读 3 分钟
195
文献搜索对于广大学子来说真的是个麻烦事,如果你的学校购买的论文下载权限不够多,或者不在校园内,那就很头痛了。幸好,我们有Python制作的这个论文搜索工具,简化了我们学习的复杂性。

Python 超级简单精准计算地点日出日落时间

2020-05-04
阅读 3 分钟
742
原文来自Python实用宝典:Python 超级简单精准计算地点日出日落时间 本来想浪漫一把去看个日出,过去后看见天上挂着个大太阳的尴尬情景你经历过吗? 本来想去海边看个日落,结果车到了,太阳也落了的悲伤情景你经历过吗? 我们今天要用Python解决的,就是这种尴尬情况:想到某个地点看日出日落,却不知道那个地方准确的...