chromedriver之"此类型文件可能会损害您的计算机"提示的处理

2019-03-17
阅读 2 分钟
11.2k
背景 最近在使用selenium进行自动文件下载时,突然出现了一个报错: 下载进行不下去了。 思路 经过各种谷歌、百度,均告诉我在要增加params,关闭浏览器安全选项,配置如下: {代码...} 事实证明,可能以前的版本是可行的,现在的真心不行。 上面配置重点是"safebrowsing.enabled": True。在MacOS的环境下,哪怕不配也是...

使用selenium实现批量文件下载

2019-03-10
阅读 2 分钟
7.2k
一般在做网络爬虫的时候,都是保存网页信息为主,或者下载单个文件。当涉及到多文件批量下载的时候,由于下载所需时间不定,下载的文件名不定,所以有一定的困难。

10分钟了解Pandas基础知识

2019-02-25
阅读 29 分钟
15.9k
在数据分析中pandas举足轻重,学习pandas最好的方法就是看官方文档,以下是根据官方文档10 Minutes to pandas学习记录。(官方标题10分钟,感觉起码得半个小时吧)

从13万猫眼评论看看《流浪地球》到底怎么样

2019-02-21
阅读 8 分钟
2.8k
背景 最近几年猫眼电影越来越热门了,都差不多和豆瓣并驾齐驱了。今年的《流浪地球》这么火,通过爬取猫眼电影上网友对该片的评价如何。 爬取猫眼评论 找到评论网页地址 先打开猫眼官网找到《流浪地球》的介绍页面:[链接] 虽然显示有112.4万人评分,但是页面只有热门短评,其他评论都去哪里了,手机明明是有的。 那么我...

Flask在Windows环境下的部署

2019-02-11
阅读 5 分钟
21.1k
背景 由于目前在用的Flask项目涉及到一部分依赖Windows的处理,还无法迁移到linux平台,那么在windows环境下,要怎么部署呢? 思路 根据Flask官网介绍,由于Flask内置的服务器性能不佳,推荐的主要的部署方式有如下几种: mod_wsgi (Apache) 独立 WSGI 容器 Gunicorn Tornado Gevent uWSGI FastCGI CGI 上述这些部署方式...

如何优雅的在flask中记录log

2019-02-01
阅读 6 分钟
40.7k
记录日志,在任何项目中,都是很重要的。在Flask项目中,即有Flask提供的logger可以用来记录log,也可以通过直接使用Python的logging模块自定义logger来记录。那么这两者是什么关系,又该怎么使用呢?