Python NumPy库的安装和使用

NumPy 就是一个数学运算的库,其是用 C 语言实现的,所以运算速度非常快。该模块也不是 Python 自带的,需要自行安装。

可以使用 PIP 进行安装,命令如下:

pip install numpy

使用该模块之前需要将其引入,常用方法是:

import numpy as np

这样以后就可以使用 np 来表示该模块了。

NumPy 最常见的数据结构是 ndarray,ndarray 表示 N-dimentioanl Array,就是多维数组的意思。本节也从这里开始介绍 NumPy。

ndarray的构造

可以使用多种方式来构建多维数组,最常见的是使用列表来构建多维数组。下面的例子便使用一维列表构建了一个一维数组。
>>> import numpy as np
>>> nda1 = np.array([1, 2, 3])        # 使用一维列表来作为输入
>>> nda1                       
array([1, 2, 3])6    >>> type(nda1)
<class 'numpy.ndarray'>

如果希望构建二维数组,可以使用下面的方法:
>>> input_list = [
...     [1, 2, 3],
...     [4, 5, 6]
... ]
>>> nda2 = np.array(input_list)
>>> nda2
array([[1, 2, 3],                    # 查看值
       [4, 5, 6]])
>>> type(nda2)                        # 查看类型
<class 'numpy.ndarray'>

也可以指定一些特征值,让 NumPy 自动产生相关的数组。例如指定维度,让其产生所有元素都为 0 的数组,代码如下:
>>> np.zeros(5)                        # 5个元素的一维数组
array([0., 0., 0., 0., 0.])
>>> np.zeros((5, 2))                # 二维数组,5行,2列
array([[0., 0.],
       [0., 0.],
       [0., 0.],
       [0., 0.],
       [0., 0.]])

也可以指定维度,让其产生所有元素值都为 1 的数组,代码如下:
>>> np.ones((5, 2))                    # 二维数组,5行,2列,所有元素都为1
array([[1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.]])
>>> np.ones(5)                        # 一维数组,5个元素
array([1., 1., 1., 1., 1.])

还可以让 NumPy 自动产生等差数组,此时需要指定开始值、结束值和步长。代码如下:
>>> np.arange(3,7,2)                # 从3开始,直到7,步长为2
array([3, 5])
>>> np.arange(3,7,1)                # 从3开始,直到7,步长为1
array([3, 4, 5, 6])
>>> np.arange(7, 3, -1)                # 从7开始,直到3,步长为-1
array([7, 6, 5, 4])
>>> np.arange(7, 3, -2)                # 从7开始,直到3,步长为-2
array([7, 5])

arange() 函数和 range() 类似,如果仅提供一个值,那么开始值是 0,步长是 1,代码如下:
>>> np.arange(7)
array([0, 1, 2, 3, 4, 5, 6])
如果提供两个参数,那么步长为 1:
>>> np.arange(2, 5)                # 从2开始,直到5,步长为1
array([2, 3, 4])
>>> np.arange(2, 6)                # 从2开始,直到6,步长为1
array([2, 3, 4, 5])

另外一个等差数列函数是 linspace(),其指定开始位置和结束位置,但不指定步长,而是指定元素个数。例如从 1 开始,到 5 结束,一共有 8 个数,那么生成的数组如下面所示:
>>> np.linspace(1, 5, 8)        # 包括1和5,等分8个点
array([1. , 1.57142857, 2.14285714, 2.71428571, 3.28571429,
     3.85714286, 4.42857143, 5])
可以发现元素个数和指定的一致,开始值和结束值也都被包含,而且它们的确是等差数列。

linspace() 函数比较有用,例如要画正弦函数在 0 到 2π 之间的图形,便可以使用该函数在 0 到 2π 之间产生均匀分布的 100 个点,然后使用 matplotlib 将它们画出来。下面是演示的代码:
import matplotlib.pyplot as plt
import numpy as np
x  = np.linspace(0, 2*np.pi, 100)
y  = [np.sin(e) for e in x]
plt.plot(x, y)
plt.savefig("sindemo1.png")
运行后产生的图片如图 1 所示。


图 1 y=sin(x)的曲线

还可以使用 logspace() 函数让 NumPy 自动产生等比数列,此时需要指定开始点和结束点,同时指定点的个数。如果没有提供点的数目,默认是生成 50 个点。
>>> np.logspace(2.0, 3.0, num=4)    # 4个点,其实位置是102,结束位置是103
array([ 100. , 215.443469,  464.15888336, 1000.])

下面是一个例子,其演示了 logspace() 的用法和参数 endpoint 的用法。endpoint=True 表示结束值被包含在输出数组中,否则表示不包含在输出数组中。下面是完整的代码:
import matplotlib.pyplot as plt
import numpy as np
N = 10            # 一共10个点
x1 = np.logspace(0.1, 1, N, endpoint=True)        # 10被算作是最后一个点
x2 = np.logspace(0.1, 1, N, endpoint=False)    # 10不被算作是最后一个点
y = np.zeros(N)
plt.plot(x1, y, 'o')
plt.plot(x2, y + 0.5, 'x')
plt.ylim([-0.5, 1])                                # y轴的范围是-0.5到1
plt.savefig("logspace1.png")                    # 保存图片到文件
运行该脚本,得到的输出图片如图 2 所示。


图 2 logspace()的用法

还可以使用 full() 函数指定维度和一个值,让所有的元素都等于该值。该函数和 ones() 类似,但值是由用户指定的。
>>> np.full((2, 2), np.inf)                # 所有元素都是无穷大
array([[inf, inf],
       [inf, inf]])
>>> np.full((2, 2), 11)                    # 所有元素都是11
array([[11, 11],
       [11, 11]])
>>> np.full((2, 2), 1.51)                # 所有元素都是1.51
array([[1.51, 1.51],
       [1.51, 1.51]])

使用 eye() 函数还可以自动生成单位矩阵,就是仅对角线上的值为 1,其他位置上的值都为 0。
>>> np.eye(2)                                    # 2x2的单位矩阵
array([[1., 0.],
       [0., 1.]])
>>> np.eye(3)                                    # 3x3的单位矩阵
array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

还可以自动产生随机的矩阵,例如可以使用 random.normal() 函数产生一个正态分布的一维矩阵:
>>> mu, sigma = 0, 0.1                    # mu是平均值,sigma代表分散程度
>>> s = np.random.normal(mu, sigma, 1000)
>>> s.size                                        # 元素个数为1000
1000
>>> np.mean(s)                                    # 平均值接近0
-0.0011152161285000821
>>> abs(mu - np.mean(s)) < 0.01                # 平均值接近mu=0
True
>>> abs(sigma - np.std(s, ddof=1)) < 0.01        # 分散程度检查
True

可以将生成的数据画出来,使用下面的代码:
import matplotlib.pyplot as plt
import numpy as np
mu, sigma = 0, 0.1
s = np.random.normal(mu, sigma, 1000)
count, bins, ignored = plt.hist(s, 30, density=True)
plt.plot(bins, 1/(sigma * np.sqrt(2 * np.pi)) *
         np.exp( - (bins - mu)**2 / (2 * sigma**2) ),
         linewidth=2, color='r')
plt.savefig("rand1.png")
运行该脚本,得到的输出图片文件如图 3 所示。


图 3 正态分布

还可以生成完全随机的矩阵,方法是使用 np.random.rand(外形)函数。例如在下面的例子中,就生成了随机内容组成的指定外形的矩阵。
>>> np.random.rand(3,2)                    # 3x2的二维矩阵
array([[0.11319256, 0.84668147],
       [0.4040353 , 0.70912343],
       [0.6511614 , 0.80706271]])
>>> np.random.rand(3,2,2)                # 3x2x2的三维矩阵
array([[[0.64851863, 0.3895985 ],
        [0.63038544, 0.58402249]],
       [[0.39816687, 0.92149102],
        [0.07113285, 0.17109903]],
       [[0.06713956, 0.39415293],
        [0.06125844, 0.71276929]]])
>>> np.random.rand(4)                    # 一维矩阵
array([0.11918788, 0.91847982, 0.29599804, 0.42242323])