Python 虚拟环境简介(qbit)

2019-11-20
阅读 2 分钟
2.4k
管理 Python 版本pyenvSimple Python Version Management与第三方包管理工具 pyenv-virtualenv 属于同一个项目Windows 下建议使用 pyenv-win 分支GitHub url: [链接]alternativesLinux 下可以用 alternatives 切换软件默认版本(不止是切换 Python)Ubuntu-18.04 Python2 与 Python3 自由切换管理第三方包版本pyenv-vir...

pymysql中 execute 和 executemany 性能对比,以及与原生SQL 相比如何

2019-11-18
阅读 3 分钟
9k
今天在mysql中插入大批量数据时,突然想起pymysql 还有executemany 方法,那么这两个方法到底谁快?快多少? 测试环境 python3 mysql pymysql 老规矩,先上测试代码: {代码...} 测试结果 方法量级耗时(s) 1W 10W 100W execute 3.126 25.139 248.022 executemany 0.1 0.981 10.854 总结 可以看出明显的区别,,如果需要批...

Python3 urllib.parse 常用函数示例(qbit)

2019-11-15
阅读 2 分钟
1.7k
获取url参数。 {代码...} 如果你还想问为什么没有urldecode,把上面的示例看五遍。^_^ parse_qs/parse_qsl {代码...} urlencode {代码...} quote/quote_plus {代码...} unquote/unquote_plus {代码...} 域名编码避免敏感词屏蔽。 {代码...} 本文出自 qbit snap

重要外文数据库简介(qbit)

2019-11-14
阅读 5 分钟
3.9k
SCI 从 1992 年开始属于汤姆森公司ISI 于 1992 年被加拿大汤姆森公司(The Thomson Corporation)的分公司 Thomson Scientific & Healthcare 收购,于是就成了有名的 Thomson ISI

Python3 中英文时间转换

2019-11-11
阅读 1 分钟
7.3k
{代码...} 附: %a 英文星期简写 %A 英文星期的完全 %b 英文月份的简写 %B 英文月份的完全 %c 显示本地日期时间 %d 日期,取1-31 %H 小时, 0-23 %I 小时, 0-12 %m 月, 01 -12 %M 分钟,1-59 %j 年中当天的天数 %w 显示今天是星期几 %W 第几周 %x 当天日期 %X 本地的当天时间 %y 年份 00-99间 %Y 年份的完整拼写

Python3 滑块验证码的破解

2019-11-09
阅读 3 分钟
6.6k
破解滑块验证码的思路主要有2种: 获得一张完整的背景图和一张有缺口的图片,两张图片进行像素上的一一对比,找出不一样的坐标。 获得一张有缺口的图片和需要验证的小图,两张图片进行二极化以及归一化,确定小图在图片中间的坐标。 之后就要使用初中物理知识了,使用直线加速度模仿人手动操作 本次就使用第2种,第一种...

Python3 检测文件真实类型(qbit)

2019-11-08
阅读 1 分钟
4.5k
测试环境 {代码...} 安装 filetype {代码...} 示例 code {代码...} 运行 {代码...} 相关链接 filetype GitHub 网址: [链接] 检测工具: TrIDNet - File Identifier 本文出自 qbit snap

Requests: 为人类设计的 HTTP 库

2019-10-23
阅读 3 分钟
3.8k
简介 Requests 是一个优雅易用的 HTTP 库,专为人类构建 Requests 的作者是 Kenneth Reitz 2019年,为专注于 requests3 的开发,Kenneth Reitz 将 requests2 转交给 PSF(Python 软件基金会)维护 PyPI 地址: [链接] 本文环境 {代码...} 安装 {代码...} {代码...} 技巧与示例 cookie 添加 cookie {代码...} 如果 sn.head...

XPath 与 CSS (parsel)

2019-10-23
阅读 2 分钟
3.1k
前言 XPath 即为XML路径语言(XML Path Language) 层叠样式表(Cascading Style Sheets)是一种用来表现 HTML或XML等文件样式的计算机语言 parsel 是从 Scrapy 独立出来的解析器,可以用 XPath 或 CSS 提取 XML 或 HTML 实例 XPath 取字符串包含的方法 {代码...} {代码...} XPath 与 CSS 比对 {代码...} {代码...} {代...

Python3 读取 toml 配置文件(UTF-8/UTF-8-BOM)

2019-10-17
阅读 2 分钟
3.6k
吐槽    先吐槽一下其他几个配置文件。ini:表达能力不够,比如不能表达列表等结构;没有官方注释符号,虽然一般以分号作为注释符号。json:没有官方注释符号,虽然某些第三方包提供了注释结构。yaml:语法比较复杂,可读性不太高。toml 简介TOML是前GitHub CEO, Tom Preston-Werner,于2013年创建的语言,其目标是成为...

Linux 查看某个用户组的所有用户(Python实现)

2019-10-17
阅读 1 分钟
2k
code {代码...} 使用 {代码...}

Linux 系统资源查看(qbit)

2019-10-17
阅读 3 分钟
1.8k
OS 版本 {代码...} 系统资源概览 {代码...} 内存 {代码...} 磁盘磁盘型号 {代码...} 随机读写 iops {代码...} 读写吞吐量 {代码...} 磁盘转速 {代码...} 分区与容量 {代码...} 快速检查磁盘是否健康 {代码...} 查看磁盘读写次数 {代码...} 查看磁盘 io {代码...} {代码...} CPU {代码...} 主板 {代码...} lshw查看 class...

关于 SUID, SGID 和 Sticky(qbit)

2019-10-17
阅读 1 分钟
1.4k
SUID Set-user Identification SUID 属性只能运用在可执行文件上,当用户执行该执行文件时,会临时拥有该可执行文件所有者的权限。 示例 {代码...} SGID Set-group identification SGID 属性可以应用在目录或可执行文件上。当SGID属性应用在目录上时,该目录中所有建立的文件或子目录的拥有组都会是该目录的拥有组。 示...

Linux 用户管理相关命令(qbit)

2019-10-17
阅读 1 分钟
1.7k
相关文件口令文件(/etc/passwd)中的登录项有7个以冒号分隔的字段组成,依次是: {代码...} 加密口令存放在 /etc/shadow 中。组文件(/etc/group)将组名映射为数值的组ID,其中4个字段依次是: {代码...} 用户相关创建用户 {代码...} {代码...} 删除用户 {代码...} 创建或修改用户密码 {代码...} 查看用户登录日志。 {...

VSCode Tips(qbit)

2019-10-16
阅读 2 分钟
1.6k
快捷键打开命令面板,快速打开最近使用的文件 {代码...} 打开命令面板,显示所有命令 {代码...} 跳转到行 {代码...} 函数列表 {代码...} 列编辑 {代码...} 格式化整个文档 {代码...} 格式化选定代码 {代码...} 快捷键官方文档:Key Bindings for Visual Studio Codesettings.json {代码...} Pythonflake8 + yapf(推荐)...

Spark2 的序列化(JavaSerializer/KryoSerializer)

2019-10-12
阅读 3 分钟
9.7k
KryoSerializer 比 JavaSerializer 效率高很多,但是不支持所有对象的序列化(比如??),在使用时需要手动注册自定义类。如果不注册,性能比 JavaSerializer 更糟糕。

IntelliJ IDEA Tips

2019-10-11
阅读 1 分钟
2k
生成注释 idea自动生成方法注释(含参数及返回值) qbit 在 IntelliJ IDEA 2019.2 社区版的设置如下Template text {代码...} groovy 脚本 {代码...} maven 添加本地 jar 包 添加到本地仓库 以添加 4mc 2.1.0 为例进入 bin 目录,qbit 的路径是 {代码...} 进入 cmd 执行命令 {代码...} pom.xml 添加依赖 {代码...} 本文出...

Oozie(HUE) 调度 Spark2

2019-10-11
阅读 6 分钟
3.9k
环境 {代码...} yarn local 模式 进入 Workspace 进入 lib 目录,并上传 jar 和 配置文件 拖拽 Spark Program 选择刚才的 lib 目录 填入 jar 名称,点击 add 确认 填写业务主类名称,并配置参数 点击小齿轮,查看其他参数 保存配置 提交运行 yarn cluster 模式 进入 Workspace 进入 lib 目录,并上传 jar 和 配置文件 拖...

Spark RDD 转化操作与行动操作

2019-09-25
阅读 3 分钟
4.5k
本文摘自《Spark 快速大数据分析》概述RDD 支持两种操作:转化操作(Transformation)和行动操作(Action)。转化操作时返回一个新的 RDD 的操作,比如 map() 和 filter()。行动操作则是向驱动器程序返回结果或把结果写入外部系统的操作,会触发实际的计算,比如 count() 和first()。Spark 对待转化操作和行动操作的方式...

Spark 2.x 与 Java 8 下 WordCount 示例

2019-09-25
阅读 7 分钟
4k
运行环境 {代码...} RDD, 不用 lambda,reduceByKey import {代码...} main {代码...} RDD + reduceByKey import {代码...} main {代码...} RDD + countByValue import {代码...} main {代码...} DataFrame/DataSet + SQL import {代码...} main {代码...} DataSet/DataFrame + groupBy import {代码...} main {代码...}...

AES 加密解密示例(qbit)

2019-09-19
阅读 2 分钟
2.2k
密码学中的高级加密标准(Advanced Encryption Standard,AES),又称Rijndael加密法,是美国联邦政府采用的一种区块加密标准。这个标准用来替代原先的DES(Data Encryption Standard),已经被多方分析且广为全世界所使用。经过五年的甄选流程,高级加密标准由美国国家标准与技术研究院 (NIST)于2001年11月26日发布于...

Hadoop MapReduce Spark 配置项

2019-09-19
阅读 1 分钟
2.8k
适用范围 本文涉及到的配置项主要针对 Hadoop 2.x,Spark 2.x。 MapReduce 官方文档 [链接]左下角: mapred-default.xml 配置项举例 name value description mapreduce.job.reduce.slowstart.completedmaps 0.05 当 Map Task 完成的比例达到该值后才会为 Reduce Task 申请资源 mapreduce.output.fileoutputformat.compres...

数据库相关概念梳理(qbit)

2019-09-08
阅读 3 分钟
2.9k
设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。

MurmurHash Tips(qbit)

2019-09-06
阅读 6 分钟
4.5k
MurmurHash 是一种非加密型哈希函数(Non-cryptographic hash function),适用于一般的哈希检索操作。与其它流行的哈希函数相比,对于规律性较强的 key,MurmurHash 的随机分布特征表现更良好。

Python3 文件(夹)基本操作(qbit)

2019-08-30
阅读 3 分钟
4.5k
相关模块osos.pathshutilpathlib(New in version 3.4)基本操作判断文件(夹)是否存在。 {代码...} 判断路径名是否为文件。 {代码...} 判断路径名是否为目录。 {代码...} 创建文件。 {代码...} 复制文件。 {代码...} 删除文件。 {代码...} 清空文件。 {代码...} 创建目录。 {代码...} 复制目录。 {代码...} 重命名文件或...

Elasticsearch 7.x 常用命令

2019-08-27
阅读 7 分钟
6.9k
推荐学习阮一鸣《Elasticsearch 核心技术与实战》集群信息查看欢迎信息 {代码...} 查看集群是否健康 {代码...} 查看热线程 {代码...} 查看节点堆内存状况 {代码...} 查看集群配置 {代码...} 查看节点列表 {代码...} 索引查看索引查看所有索引 {代码...} 查看某个索引的状态 {代码...} 查看某个索引的 mapping {代码...} ...

关系型数据库 与 MongoDB、Elasticsearch 强行对标

2019-08-27
阅读 1 分钟
1.9k
RDBMS 即关系数据库管理系统(Relational Database Management System),是将数据组织为相关的行和列的系统,而管理关系数据库的计算机软件就是关系数据库管理系统,常用的数据库软件有Oracle、SQL Server、MySQL等。

Python 获取本机 IP/MAC(多网卡)

2019-08-22
阅读 2 分钟
12.1k
通过gethostname获取主机名,再用gethostbyname将主机名转换为IP地址。  那么,问题来了。如果主机有多个网卡/IP,怎样获取某个指定的IP地址呢?  一个方法是通过 socket.gethostbyname_ex 获取主机IP地址列表,然后遍历列表取得自己需要的IP。

Python3 格式化时间(qbit)

2019-08-22
阅读 3 分钟
2.7k
ISO 8601是国际标准化组织(ISO)制定的日期和时间的表示方法,全称为《数据存储和交换形式·信息交换·日期和时间的表示方法》。目前,ISO 8601是全球通用的日期和时间格式标准,它定义了日期和时间的表示方法,包括年、月、日、时、分、秒等1。除了ISO 8601之外,还有一些其他的日期和时间格式标准,例如RFC 3339、RFC 2...

正则备忘录(qbit)

2019-08-21
阅读 5 分钟
2.2k
本文的示例默认以 Python3 为实现语言,用到 Python3 的 re 模块或 regex 库。据 qbit 猜测:在 Python3 的 Unicode 字符集下,re模块的 \s 匹配 \f\n\r\t\v 加全角半角空格,共 7 个字符。