来了,永久免费的图床服务

4 月 7 日
阅读 3 分钟
72
前前后后也写了很多博客和文章了,作为一个资深的markdown用户,我是非常喜欢markdown的简洁语法,可以让我在不太关注于文字格式的前提下,获得比较好的阅读和排版体验。

快速上手python的简单web框架flask

2023-02-06
阅读 5 分钟
997
python可以做很多事情,虽然它的强项在于进行向量运算和机器学习、深度学习等方面。但是在某些时候,我们仍然需要使用python对外提供web服务。

数据分析实际案例之:pandas在餐厅评分数据中的使用

2022-02-25
阅读 4 分钟
1.7k
简介为了更好的熟练掌握pandas在实际数据分析中的应用,今天我们再介绍一下怎么使用pandas做美国餐厅评分数据的分析。餐厅评分数据简介数据的来源是UCI ML Repository,包含了一千多条数据,有5个属性,分别是:userID: 用户IDplaceID:餐厅IDrating:总体评分food_rating:食物评分service_rating:服务评分我们使用pa...

数据分析实际案例之:pandas在泰坦尼特号乘客数据中的使用

2022-02-24
阅读 8 分钟
1.6k
1912年4月15日,号称永不沉没的泰坦尼克号因为和冰山相撞沉没了。因为没有足够的救援设备,2224个乘客中有1502个乘客不幸遇难。事故已经发生了,但是我们可以从泰坦尼克号中的历史数据中发现一些数据规律吗?今天本文将会带领大家灵活的使用pandas来进行数据分析。

Pandas高级教程之:时间处理

2021-10-11
阅读 12 分钟
2.1k
时间应该是在数据处理中经常会用到的一种数据类型,除了Numpy中datetime64 和 timedelta64 这两种数据类型之外,pandas 还整合了其他python库比如 scikits.timeseries 中的功能。

NumPy之:多维数组中的线性代数

2021-07-29
阅读 4 分钟
1.9k
简介本文将会以图表的形式为大家讲解怎么在NumPy中进行多维数据的线性代数运算。多维数据的线性代数通常被用在图像处理的图形变换中,本文将会使用一个图像的例子进行说明。图形加载和说明熟悉颜色的朋友应该都知道,一个颜色可以用R,G,B来表示,如果更高级一点,那么还有一个A表示透明度。通常我们用一个四个属性的数...

Pandas高级教程之:自定义选项

2021-07-22
阅读 12 分钟
1.8k
pandas有一个option系统可以控制pandas的展示情况,一般来说我们不需要进行修改,但是不排除特殊情况下的修改需求。本文将会详细讲解pandas中的option设置。

Pandas高级教程之:稀疏数据结构

2021-07-20
阅读 3 分钟
2.8k
如果数据中有很多NaN的值,存储起来就会浪费空间。为了解决这个问题,Pandas引入了一种叫做Sparse data的结构,来有效的存储这些NaN的值。

Pandas高级教程之:GroupBy用法

2021-07-12
阅读 10 分钟
2k
pandas中的DF数据类型可以像数据库表格一样进行groupby操作。通常来说groupby操作可以分为三部分:分割数据,应用变换和和合并数据。

Pandas高级教程之:统计方法

2021-07-08
阅读 7 分钟
1.4k
简介数据分析中经常会用到很多统计类的方法,本文将会介绍Pandas中使用到的统计方法。变动百分百Series和DF都有一个pct_change() 方法用来计算数据变动的百分比。这个方法在填充NaN值的时候特别有用。 {代码...} pct_change还有个periods参数,可以指定计算百分比的periods,也就是隔多少个元素来计算: {代码...} Covar...

Pandas高级教程之:plot画图详解

2021-07-07
阅读 12 分钟
5.6k
python中matplotlib是非常重要并且方便的图形化工具,使用matplotlib可以可视化的进行数据分析,今天本文将会详细讲解Pandas中的matplotlib应用。

Pandas高级教程之:category数据类型

2021-06-28
阅读 9 分钟
4.4k
Pandas中有一种特殊的数据类型叫做category。它表示的是一个类别,一般用在统计分类中,比如性别,血型,分类,级别等等。有点像java中的enum。

Pandas高级教程之:处理缺失数据

2021-06-24
阅读 10 分钟
1.4k
在数据处理中,Pandas会将无法解析的数据或者缺失的数据使用NaN来表示。虽然所有的数据都有了相应的表示,但是NaN很明显是无法进行数学运算的。

Pandas高级教程之:处理text数据

2021-06-23
阅读 8 分钟
1.9k
在1.0之前,只有一种形式来存储text数据,那就是object。在1.0之后,添加了一个新的数据类型叫做StringDtype 。今天将会给大家讲解Pandas中text中的那些事。

Pandas高级教程之:Dataframe的重排和旋转

2021-06-15
阅读 12 分钟
1.5k
简介使用Pandas的pivot方法可以将DF进行旋转变换,本文将会详细讲解pivot的秘密。使用Pivotpivot用来重组DF,使用指定的index,columns和values来对现有的DF进行重构。看一个Pivot的例子:通过pivot变化,新的DF使用foo中的值作为index,使用bar的值作为columns,zoo作为对应的value。再看一个时间变化的例子: {代码......

Pandas高级教程之:Dataframe的合并

2021-06-14
阅读 11 分钟
2.5k
Pandas提供了很多合并Series和Dataframe的强大的功能,通过这些功能可以方便的进行数据分析。本文将会详细讲解如何使用Pandas来合并Series和Dataframe。

Pandas之:深入理解Pandas的数据结构

2021-06-11
阅读 6 分钟
3.6k
[toc]简介本文将会讲解Pandas中基本的数据类型Series和DataFrame,并详细讲解这两种类型的创建,索引等基本行为。使用Pandas需要引用下面的lib: {代码...} SeriesSeries是一维带label和index的数组。我们使用下面的方法来创建一个Series: {代码...} 这里的data可以是Python的字典,np的ndarray,或者一个标量。index是...

Pandas之:Pandas高级教程以铁达尼号真实数据为例

2021-06-07
阅读 14 分钟
2.3k
简介今天我们会讲解一下Pandas的高级教程,包括读写文件、选取子集和图形表示等。读写文件数据处理的一个关键步骤就是读取文件进行分析,然后将分析处理结果再次写入文件。Pandas支持多种文件格式的读取和写入: {代码...} 接下来我们会以Pandas官网提供的Titanic.csv为例来讲解Pandas的使用。Titanic.csv提供了800多个...

Pandas之:Pandas简洁教程

2021-06-05
阅读 12 分钟
1.8k
作变得更快更简单的数据结构和操作⼯具。pandas经常和其它⼯具⼀同使⽤,如数值计算⼯具NumPy和SciPy,分析库statsmodels和scikit-learn,和数据可视化库matplotlib等。

NumPy之:ndarray中的函数

2021-05-24
阅读 6 分钟
2.3k
简介在NumPy中,多维数组除了基本的算数运算之外,还内置了一些非常有用的函数,可以加快我们的科学计算的速度。简单函数我们先看下比较常见的运算函数,在使用之前,我们先构造一个数组: {代码...} {代码...} 计算数组中元素的开方: {代码...} {代码...} 自然常数e为底的指数函数: {代码...} {代码...} 取两个数组的...

NumPy之:ndarray多维数组操作

2021-05-19
阅读 7 分钟
2.6k
NumPy一个非常重要的作用就是可以进行多维数组的操作,多维数组对象也叫做ndarray。我们可以在ndarray的基础上进行一系列复杂的数学运算。

NumPy之:理解广播

2021-05-12
阅读 3 分钟
1.9k
广播描述的是NumPy如何计算不同形状的数组之间的运算。如果是较大的矩阵和较小的矩阵进行运算的话,较小的矩阵就会被广播,从而保证运算的正确进行。

NumPy之:使用genfromtxt导入数据

2021-05-08
阅读 4 分钟
4.1k
在做科学计算的时候,我们需要从外部加载数据,今天给大家介绍一下NumPy中非常有用的一个方法genfromtxt。genfromtxt可以分解成两步,第一步是从文件读取数据,并转化成为字符串。第二步就是将字符串转化成为指定的数据类型。

NumPy之:结构化数组详解

2021-05-06
阅读 8 分钟
2.9k
简介普通的数组就是数组中存放了同一类型的对象。而结构化数组是指数组中存放不同对象的格式。今天我们来详细探讨一下NumPy中的结构化数组。结构化数组中的字段field因为结构化数组中包含了不同类型的对象,所以每一个对象类型都被称为一个field。每个field都有3部分,分别是:string类型的name,任何有效dtype类型的typ...

NumPy之:数据类型对象dtype

2021-04-30
阅读 6 分钟
3.5k
之前讲到了NumPy中有多种数据类型,每种数据类型都是一个dtype(numpy.dtype )对象。今天我们来详细讲解一下dtype对象。

NumPy之:标量scalars

2021-04-25
阅读 3 分钟
2.2k
Python语言中只定义了特定数据类的一种类型(比如只有一种整数类型,一种浮点类型等)。在不需要关注计算机中数据表示方式的普通应用程序中,这样做很方便。但是,对于科学计算来说,我们需要更加精确的控制类型。

NumPy之:数据类型

2021-04-23
阅读 5 分钟
2.6k
简介我们知道Python中有4种数字类型,分别是int,float,bool和complex。作为科学计算的NumPy,其数据类型更加的丰富。今天给大家详细讲解一下NumPy中的数据类型。数组中的数据类型NumPy是用C语言来实现的,我们可以对标一下NumPy中数组中的数据类型跟C语言中的数据类型:Numpy 中的类型C 中的类型说明np.bool_boolBoole...

NumPy之:NumPy简介教程

2021-04-21
阅读 11 分钟
4.5k
NumPy是一个开源的Python库,主要用在数据分析和科学计算,基本上可以把NumPy看做是Python数据计算的基础,因为很多非常优秀的数据分析和机器学习框架底层使用的都是NumPy。比如:Pandas, SciPy, Matplotlib, scikit-learn, scikit-image 等。

Python基础之:struct和格式化字符

2021-04-16
阅读 4 分钟
3.2k
文件的存储内容有两种方式,一种是二进制,一种是文本的形式。如果是以文本的形式存储在文件中,那么从文件中读取的时候就会遇到一个将文本转换为Python中数据类型的问题。实际上即使是文本的形式存储,存储的数据也是也是有结构的,因为Python底层是用C来编写的,这里我们也称之为C结构。

可视化运行Python的神器Jupyter Notebook

2021-04-13
阅读 6 分钟
4.5k
如果我们想要运行Python,通常有两种方式,第一种方式就是在Python或者IPython的解释器环境中进行交互式运行,还有一种方式就是程序员最喜欢的编写.py文件,在文件中编写python代码,然后运行。