SF
Python学习笔记
Python学习笔记
注册登录
关注博客
注册登录
主页
关于
RSS
计算机网络-划分子网
syushin
2019-07-09
阅读 2 分钟
3.3k
IP地址是给因特网上的每一个主机(或路由器)的每一个接口分配一个在全世界范围是唯一的32位标识符。层次化IP地址将32位的IP地址分为网络ID和主机ID。
SQL笔记:MySQL基础
syushin
2019-06-08
阅读 2 分钟
1.5k
SQL基本语句 数据库操作 {代码...} 表操作 查看当前数据库中所有表 {代码...} 创建表 {代码...} 删除表 {代码...} 查看表结构 {代码...} 修改表 {代码...} 说明:添加字段命令中,first和after 已存在的字段名都是可选参数,first用于将新添加的字段设置为表的第一个字段,after用于将新添加的字段添加到指定的'已存在的字...
Python | 用matplotlib画些简单的图
syushin
2019-05-05
阅读 2 分钟
4.6k
环境是python3.7,工具使用的是jupyter-notebook交互式笔记本 引入相关库 {代码...} 画图之前的设置: {代码...} 画一张折线图: {代码...} 最终画出的折现图如下: 在上面的图中再添加一条折线图: {代码...} plt.legend()函数只是一个开关的作用,写了就代表开启图例的标注,上述代码也等价于: {代码...} 最终效果: ...
数据科学库pandas笔记3
syushin
2019-05-02
阅读 5 分钟
1.5k
1. 缺失数据的表现对于一些数据,可能某些值是空的,是缺失的。pandas中可以有多种处理缺失数据的方式。在pandas中,缺失数据的表现是NaN(Not a Number),可以使用isnull()函数检测出是否有数据缺失。
数据科学库pandas笔记2
syushin
2019-05-01
阅读 7 分钟
2.2k
对于pandas来说,掌握了Series和DataFrame的基本使用后,pandas还提供了很多高阶的函数与方法可以实现更加高级的功能,使用它们可以提高分析的效率,满足更多的需求。
数据科学库pandas笔记1
syushin
2019-04-30
阅读 9 分钟
2.4k
pandas中有两种数据结构Series和DataFrame,Series类似于Numpy中的一维数组,这里就不详细记录了。主要记录下DataFrame的常见使用。
CentOS7升级python2.7.5到python3.7以上版本
syushin
2019-04-10
阅读 1 分钟
24.5k
CentOS7中自带的python版本是python-2.7.5,由于新开的虚拟机需要使用python3,于是便升级一下版本。 安装Python3.7.3 官网下载地址:[链接] 这里选择下载python 3.7.3。 {代码...} 关于Python3.7以上的版本,需要多安装一个依赖包: {代码...} 否则会出现ModuleNotFoundError: No module named '_ctypes'的报错。 在make...
Python爬虫 | JSON格式数据的提取和保存
syushin
2019-03-21
阅读 3 分钟
9.3k
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,它使得人们很容易的进行阅读和编写。同时也方便了机器进行解析和生成。适用于进行数据交互的场景,比如网站前台与后台之间的数据交互。Python中自带了json模块,直接import json即可使用
Python爬虫 | BeautifulSoup使用
syushin
2019-03-15
阅读 5 分钟
8.2k
lxml 只会局部遍历,而Beautiful Soup 是基于HTML DOM的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于lxml。
Python爬虫 | 解析库Xpath的使用
syushin
2019-02-22
阅读 6 分钟
6.7k
当爬取到Html数据后,可以用正则对数据进行提取,但有时候正则表达式编写起来不方便,而且万一写错了,可能导致匹配失败。这时候就需要借助其他解析工具了。
Python | re模块与正则表达式
syushin
2019-02-20
阅读 7 分钟
2.4k
正则表达式(英语:Regular Expression,在代码中常简写为regex、regexp或RE),又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法,是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些匹配某个模式...
Python爬虫 | 爬虫概述
syushin
2019-02-07
阅读 3 分钟
4.3k
学习python爬虫的背景了解。 大数据时代数据获取方式 如今,人类社会已经进入了大数据时代,数据已经成为必不可少的部分,可见数据的获取非常重要,而数据的获取的方式大概有下面几种。 企业生产的数据,大型互联网公司有海量的用户,所以他们积累数据有天然的优势 数据管理资讯公司 政府/机构提供的公开数据 第三方数据...
Python | numpy入门
syushin
2019-01-23
阅读 8 分钟
1.7k
最近的爬虫学习告一段落,后续补上爬虫的笔记。现在到数据分析部分,先从NumPy开始(环境python-3.6.5) 2019/1/23 NumPy基础 NumPy是高性能科学计算和数据分析的基础包。包括以下几个功能: ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组; 用于对整组数据进行快速运算的标准数学函数(无需编写循...
数据结构 | 线性表
syushin
2019-01-14
阅读 3 分钟
1.7k
在程序中,经常需要将一组(通常是同为某个类型的)数据元素作为整体管理和使用,需要创建这种元素组,用变量记录它们,传进传出函数等。一组数据中包含的元素个数可能发生变化(可以增加或删除元素)。
Python | 多线程
syushin
2019-01-08
阅读 4 分钟
1.3k
线程(轻量级进程)与进程类似,不过它们是在同一个进程下执行的,并共享相同的上下文。可以将它们认为是在一个主进程或"主线程"中并行运行的一些"迷你进程"。
Python | 网络编程
syushin
2019-01-07
阅读 2 分钟
1.5k
套接字是计算机网络数据结构,它体现了通信端点的概念。在任何类型的通信开始之前,网络应用程序必须创建套接字。可以将它比作电话插孔,没有它无法进行通信。
Python | 进程编程
syushin
2018-12-24
阅读 7 分钟
2.6k
多任务处理是指用户可以在同一时间内运行多个应用程序,每个应用程序被称作一个任务.Linux就是一个支持多任务的操作系统,比起单任务系统它的功能增强了许多.
Python | 基础
syushin
2018-12-19
阅读 1 分钟
2.1k
注释 在python中,注释是以任何存在于#右侧的文字,其主要作用是写给程序读者看的笔记。 {代码...} Python2的中文编码问题 python2中默认的编码不支持中文,如果要在python2中支持中文,需要在.py文件的开头声明使用的编码。 {代码...} python2和python3中输入功能不同 python2和python3中获取输入的方法不同,需要注意所...