Python数据分析:seaborn

2019-01-14
阅读 8 分钟
5.9k
seaborn是python中的一个非常强大的数据可视化库,它集成了matplotlib,下图为seaborn的官网,如果遇到疑惑的地方可以到官网查看。[链接] 从官网的主页我们就可以看出,seaborn在数据可视化上真的非常强大。

Python数据分析:matplotlib

2019-01-14
阅读 3 分钟
3.6k
matplotlib是python中的一个数据可视化库,可以做出很多数据统计图,下面来说一说matplotlib的一些基本使用。 1.首先引入和数据分析有关的库。 {代码...} 2.然后使用pandas读入数据。 3.fig = plt.figure(figsize=(m,n)):规定一个长为m,宽为n的画图区域。 4.plt.xlabel(""):规定横轴名称。 5.plt.ylabel(""):规定纵...

Python数据分析:pandas常用函数

2019-01-13
阅读 3 分钟
2.8k
pandas是python中的 一个数据处理库,同样在使用的时候我们要先输入import pandas as pd引入。 1.df = pd.read_csv("文件路径"):这是读取csv文件的方法,如果要读取excel或其他文档,都有相应的read函数。 2.df.dtypes:如果在文件中有字符型数据返回的是object。 3.df.head(n):将前n行数据显示出来,如果不传入参数则...

Python数据分析:numpy常用函数

2019-01-13
阅读 2 分钟
3.5k
numpy是python中一个与科学计算有关的库,本文将介绍一些常用的numpy函数,使用numpy之前需要先引入,输入import numpy as np,我们一般将numpy简化为np。

蒙特卡罗方法(python实现)

2019-01-13
阅读 2 分钟
2.9k
蒙特卡罗方法是一种统计模拟方法,由冯·诺依曼和乌拉姆提出,在大量的随机数下,根据概率估计结果,随机数据越多,获得的结果越精确。下面我们将用python实现蒙特卡罗方法。

Python数据分析:手写数字识别初步

2019-01-13
阅读 2 分钟
7.5k
1.手写数字识别是python图像处理的基础,首先需要安装pillow,我们需要以管理员身份打开Windows命令行并输入pip install pillow,如果提示pip需要更新,我们输入python -m pip install --upgrade pip先更新pip,这时再安装pillow就没问题了。

Python数据分析:KNN算法(k-近邻算法)

2019-01-13
阅读 3 分钟
8.2k
KNN算法是一种数据分类算法,以距离样本k个最邻近数据的类别代表样本的类别,因此也叫作k-近邻算法。KNN算法是数据挖掘中最简单的方法之一,大致可分为以下几个步骤:

Python数据分析:直方图及子图的绘制

2019-01-13
阅读 2 分钟
5.6k
1.直方图的绘制也需要用到matplotlib下的pylab,只不过在绘制折线图时我们采用的是plot(),而绘制直方图时我们需要采用hist()。由于在绘制过程中缺少真实数据,我在这里采用np.random.normal(a,b,c)生成的随机数绘制直方图,a为平均值,b为标准差,c为生成数据的个数。利用np.arange(a,b,c)确定直方图x轴的范围及间距,a...

Python数据分析:折线图和散点图的绘制

2019-01-13
阅读 2 分钟
5.3k
1.绘制折线图和散点图要用到matplotlib下的pylab,因此我们需要先引入,因为要用到数组实现,还要引入numpy。然后确定x轴和y轴的数据,最后将其呈现出来。

Python数据分析:简单统计量的计算

2019-01-13
阅读 3 分钟
4.2k
1.这些操作都要确保已经在电脑中安装好了Anaconda集成库,如果安装好后运行出错误,可以将原来电脑中的python卸载重新安装Anaconda,建议安装时直接将添加环境变量打勾,否则以后得自己添加环境变量,在Pycharm中的编译器选择Anaconda安装文件夹中的python。在Pycharm中新建一个data文件夹用来存放数据文件。