Numpy 小结

Python 真火来学习一下，先来看一个库 NumPy。NumPy是Python语言的一个扩充程序库。支持高级大量的维度数组与矩阵运算，此外也针对数组运算提供大量的数学函数库。

1. 读取文件

numpy.genfromtxt() 用于读取 txt 文件，其中传入的参数依次为：

需要读取的 txt 文件位置，此处文件与程序位于同一目录下
分割的标记
转换类型，如果文件中既有文本类型也有数字类型，就先转成文本类型

help(numpy.genfromtxt)用于查看帮助文档：
如果不想看 API 可以启动一个程序用 help 查看指令的详细用法

import numpy

world_alcohol = numpy.genfromtxt("world_alcohol.txt", delimiter=",",dtype=str)
print(type(world_alcohol))
print(world_alcohol)
print(help(numpy.genfromtxt))

2. 构造 ndarray

numpy.array()构造 ndarray

numpy.array()中传入数组参数，可以是一维的也可以是二维三维的。numpy 会将其转变成 ndarray 的结构。

vector = numpy.array([1,2,3,4])
matrix = numpy.array([[1,2,3],[4,5,6]])

传入的参数必须是同一结构,不是同一结构将发生转换。

vector = numpy.array([1,2,3,4])

array([1, 2, 3, 4])

均为 int 类型

vector = numpy.array([1,2,3,4.0])

array([ 1.,  2.,  3.,  4.])

转为浮点数类型

vector = numpy.array([1,2,'3',4])

array(['1', '2', '3', '4'],dtype='<U21')

转为字符类型

利用 .shape 查看结构

能够了解 array 的结构，debug 时通过查看结构能够更好地了解程序运行的过程。

print(vector.shape)
print(matrix.shape)
(4,)
(2, 3)

利用 dtype 查看类型

vector = numpy.array([1,2,3,4])
vector.dtype

dtype('int64')

ndim 查看维度

一维

vector = numpy.array([1,2,3,4])
vector.ndim

1

二维

matrix = numpy.array([[1,2,3],
                      [4,5,6],
                     [7,8,9]])
matrix.ndim

2

size 查看元素数量

matrix.size
9

3. 获取与计算

numpy 能使用切片获取数据

matrix = numpy.array([[1,2,3],
                      [4,5,6],
                     [7,8,9]])

根据条件获取

numpy 能够依次比较 vector 和元素之间是否相同

vector = numpy.array([5, 10, 15, 20])
vector == 10

array([False,  True, False, False], dtype=bool)

根据返回值获取元素

vector = numpy.array([5, 10, 15, 20])
equal_to_ten = (vector == 10)
print(equal_to_ten)
print(vector[equal_to_ten])

[False  True False False]
[10]

进行运算之后获取

vector = numpy.array([5, 10, 15, 20])
equal_to_ten_and_five = (vector == 10) & (vector == 5)

vector = numpy.array([5, 10, 15, 20])
equal_to_ten_or_five = (vector == 10) | (vector == 5)

类型转换

将整体类型进行转换

vector = numpy.array([5, 10, 15, 20])
print(vector.dtype)
vector = vector.astype(str)
print(vector.dtype)

int64
<U21

求和

sum() 能够对 ndarray 进行各种求和操作，比如分别按行按列进行求和

matrix = numpy.array([[1,2,3],
                      [4,5,6],
                     [7,8,9]])
print(matrix.sum())
print(matrix.sum(1))
print(matrix.sum(0))

45
[ 6 15 24]
[12 15 18]

sum(1) 是 sum(axis=1)) 的缩写，1表示按照 x轴方向求和，0表示按照y轴方向求和

4. 常用函数

reshape

生成从 0-14 的 15 个数字，使用 reshape(3,5) 将其构造成一个三行五列的 array。

import numpy as np
arr = np.arange(15).reshape(3, 5)
arr

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

zeros

生成指定结构的默认为 0. 的 array

np.zeros ((3,4))

array([[ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.]])

ones

生成一个三维的 array,通过 dtype 指定类型

np.ones( (2,3,4), dtype=np.int32 )

array([[[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]],

       [[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]]])

range

指定范围和数值间的间隔生成 array，注意范围包左不包右

np.arange(0,10,2)

array([0, 2, 4, 6, 8])

random 随机数

生成指定结构的随机数，可以用于生成随机权重

np.random.random((2,3))

array([[ 0.86166627,  0.37756207,  0.94265883],
       [ 0.9768257 ,  0.96915312,  0.33495431]])

5. ndarray 运算

元素之间依次相减相减

a = np.array([10,20,30,40])
b = np.array(4)

a - b
array([ 6, 16, 26, 36])

乘方

a**2
array([ 100,  400,  900, 1600])

开根号

np.sqrt(B)

array([[ 1.41421356,  0.        ],
       [ 1.73205081,  2.        ]])

e 求方

np.exp(B)

array([[  7.3890561 ,   1.        ],
       [ 20.08553692,  54.59815003]])

向下取整

a = np.floor(10*np.random.random((2,2)))
a

array([[ 0.,  0.],
       [ 3.,  6.]])

行列变换

a.T

array([[ 0.,  3.],
       [ 0.,  6.]])

变换结构

a.resize(1,4)
a

array([[ 0.,  0.,  3.,  6.]])

6. 矩阵运算

矩阵之间的运算

A = np.array( [[1,1],
               [0,1]] )
B = np.array( [[2,0],
               [3,4]] )

对应位置一次相乘

A*B

array([[2, 0],
       [0, 4]])

矩阵乘法

print (A.dot(B))
print(np.dot(A,B))

[[5 4]
 [3 4]]

横向相加

a = np.floor(10*np.random.random((2,2)))
b = np.floor(10*np.random.random((2,2)))

print(a)
print(b)
print(np.hstack((a,b)))

[[ 2.  3.]
 [ 9.  3.]]
[[ 8.  1.]
 [ 0.  0.]]
[[ 2.  3.  8.  1.]
 [ 9.  3.  0.  0.]]

纵向相加

print(np.vstack((a,b)))

[[ 2.  3.]
 [ 9.  3.]
 [ 8.  1.]
 [ 0.  0.]]

矩阵分割

#横向分割
print( np.hsplit(a,3))
#纵向风格
print(np.vsplit(a,3))

7. 复制的区别

地址复制

通过 b = a 复制 a 的值，b 与 a 指向同一地址，改变 b 同时也改变 a。

a = np.arange(12)
b = a
print(a is b)

print(a.shape)
print(b.shape)
b.shape = (3,4)
print(a.shape)
print(b.shape)

True
(12,)
(12,)
(3, 4)
(3, 4)

复制值

通过 a.view() 仅复制值，当对 c 值进行改变会改变 a 的对应的值，而改变 c 的 shape 不改变 a 的 shape

a = np.arange(12)
c = a.view()
print(c is a)

c.shape = 2,6
c[0,0] = 9999

print(a)
print(c)

False
[9999    1    2    3    4    5    6    7    8    9   10   11]
[[9999    1    2    3    4    5]
 [   6    7    8    9   10   11]]

完整拷贝

a.copy() 进行的完整的拷贝，产生一份完全相同的独立的复制

a = np.arange(12)
c = a.copy()
print(c is a)

c.shape = 2,6
c[0,0] = 9999

print(a)
print(c)

False
[ 0  1  2  3  4  5  6  7  8  9 10 11]
[[9999    1    2    3    4    5]
 [   6    7    8    9   10   11]]