快捷導(dǎo)航

numpy模塊中axis的理解與使用

更新時間：2022年03月24日 11:07:54 作者：fangjian1204

而在numpy中有很多的函數(shù)都涉及到axis,numpy中的軸axis是很重要的,許多numpy的操作根據(jù)axis的取值不同,作出的操作也不相同,這篇文章主要給大家介紹了關(guān)于numpy模塊中axis的理解與使用的相關(guān)資料,需要的朋友可以參考下

首先為什么會有axis這個概念？

因為在numpy模塊中，大多數(shù)處理的是矩陣或者多維數(shù)組，同時，對多維數(shù)組或者矩陣的操作有多種可能，為了幫助實現(xiàn)對數(shù)組或矩陣各種各樣的功能，就有了axis

下面舉個例子，選取不同的axis，對二維數(shù)組進(jìn)行sum,mean,min，max的操作

>>> import numpy as np
>>> arr=np.arange(16).reshape(2,4,2)
>>> arr
array([[[ 0,  1],
        [ 2,  3],
        [ 4,  5],
        [ 6,  7]],

       [[ 8,  9],
        [10, 11],
        [12, 13],
        [14, 15]]])

axis的作用即如何理解

numpy是python進(jìn)行科學(xué)計算必不可少的模塊，隨著深度學(xué)習(xí)越來越火，numpy也越來越流行。了解numpy的人知道，在numpy中，有很多的函數(shù)都涉及到axis，很多函數(shù)根據(jù)axis的取值不同，得到的結(jié)果也完全不同。可以說，axis讓numpy的多維數(shù)組變的更加靈活，但也讓numpy變得越發(fā)難以理解。這里通過詳細(xì)的例子來學(xué)習(xí)下，axis到底是什么，它在numpy中的作用到底如何。

為什么會有axis這個東西，原因很簡單：numpy是針對矩陣或者多為數(shù)組進(jìn)行運(yùn)算的，而在多維數(shù)組中，對數(shù)據(jù)的操作有太多的可能，我們先來看一個例子。比如我們有一個二維數(shù)組：

>>> import numpy as np
>>> data = np.array([
... [1,2,1],
... [0,3,1],
... [2,1,4],
... [1,3,1]])

這個數(shù)組代表了樣本數(shù)據(jù)的特征，其中每一行代表一個樣本的三個特征，每一列是不同樣本的特征。如果在分析樣本的過程中需要對每個樣本的三個特征求和，該如何處理？簡單：

>>> np.sum(data, axis=1)
array([4, 4, 7, 5])

那如果想求每種特征的最小值，該如何處理？也簡單：

>>> np.min(data, axis=0)
array([0, 1, 1])

又如果想得知所有樣本所有特征的平均值呢？還是很簡單：

>>> np.average(data)
1.6666666666666667

由此可以看出，通過不同的axis，numpy會沿著不同的方向進(jìn)行操作：如果不設(shè)置，那么對所有的元素操作；如果axis=0，則沿著縱軸進(jìn)行操作；axis=1，則沿著橫軸進(jìn)行操作。但這只是簡單的二位數(shù)組，如果是多維的呢？可以總結(jié)為一句話：設(shè)axis=i，則numpy沿著第i個下標(biāo)變化的放下進(jìn)行操作。例如剛剛的例子，可以將表示為：data =[[a00, a01],[a10,a11]]，所以axis=0時，沿著第0個下標(biāo)變化的方向進(jìn)行操作，也就是a00->a10, a01->a11，也就是縱坐標(biāo)的方向，axis=1時也類似。下面我們舉一個四維的求sum的例子來驗證一下：

>>> data = np.random.randint(0, 5, [4,3,2,3])
>>> data
array([[[[4, 1, 0],
         [4, 3, 0]],
        [[1, 2, 4],
         [2, 2, 3]],
        [[4, 3, 3],
         [4, 2, 3]]],

       [[[4, 0, 1],
         [1, 1, 1]],
        [[0, 1, 0],
         [0, 4, 1]],
        [[1, 3, 0],
         [0, 3, 0]]],

       [[[3, 3, 4],
         [0, 1, 0]],
        [[1, 2, 3],
         [4, 0, 4]],
        [[1, 4, 1],
         [1, 3, 2]]],

       [[[0, 1, 1],
         [2, 4, 3]],
        [[4, 1, 4],
         [1, 4, 1]],
        [[0, 1, 0],
         [2, 4, 3]]]])

當(dāng)axis=0時，numpy驗證第0維的方向來求和，也就是第一個元素值=a0000+a1000+a2000+a3000=11,第二個元素=a0001+a1001+a2001+a3001=5，同理可得最后的結(jié)果如下：

>>> data.sum(axis=0)
array([[[11,  5,  6],
        [ 7,  9,  4]],

       [[ 6,  6, 11],
        [ 7, 10,  9]],

       [[ 6, 11,  4],
        [ 7, 12,  8]]])

當(dāng)axis=3時，numpy驗證第3維的方向來求和，也就是第一個元素值=a0000+a0001+a0002=5,第二個元素=a0010+a0011+a0012=7，同理可得最后的結(jié)果如下：

>>> data.sum(axis=3)
array([[[ 5,  7],
        [ 7,  7],
        [10,  9]],

       [[ 5,  3],
        [ 1,  5],
        [ 4,  3]],

       [[10,  1],
        [ 6,  8],
        [ 6,  6]],

       [[ 2,  9],
        [ 9,  6],
        [ 1,  9]]])

使用axis的相關(guān)函數(shù)

在numpy中，使用的axis的地方非常多，處理上文已經(jīng)提到的average、max、min、sum，比較常見的還有sort和prod，下面分別舉幾個例子看一下：

sort

>>> data = np.random.randint(0, 5, [3,2,3])
>>> data
array([[[4, 2, 0],
        [0, 0, 4]],

       [[2, 1, 1],
        [1, 0, 2]],

       [[3, 0, 4],
        [0, 1, 3]]])
>>> np.sort(data)  ## 默認(rèn)對最大的axis進(jìn)行排序，這里即是axis=2
array([[[0, 2, 4],
        [0, 0, 4]],

       [[1, 1, 2],
        [0, 1, 2]],

       [[0, 3, 4],
        [0, 1, 3]]])
>>> np.sort(data, axis=0)  # 沿著第0維進(jìn)行排序，原先的a000->a100->a200轉(zhuǎn)變?yōu)閍100->a200->a000
array([[[2, 0, 0],
        [0, 0, 2]],

       [[3, 1, 1],
        [0, 0, 3]],

       [[4, 2, 4],
        [1, 1, 4]]])
>>> np.sort(data, axis=1)  # 沿著第1維進(jìn)行排序
array([[[0, 0, 0],
        [4, 2, 4]],

       [[1, 0, 1],
        [2, 1, 2]],

       [[0, 0, 3],
        [3, 1, 4]]])
>>> np.sort(data, axis=2)  # 沿著第2維進(jìn)行排序
array([[[0, 2, 4],
        [0, 0, 4]],

       [[1, 1, 2],
        [0, 1, 2]],

       [[0, 3, 4],
        [0, 1, 3]]])
>>> np.sort(data, axis=None)  # 對全部數(shù)據(jù)進(jìn)行排序
array([0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 3, 3, 4, 4, 4])

prod(即product，乘積)

 >>> np.prod([[1.,2.],[3.,4.]])
 24.0

 >>> np.prod([[1.,2.],[3.,4.]], axis=1)
 array([  2.,  12.])

 >>> np.prod([[1.,2.],[3.,4.]], axis=0)
 array([ 3.,  8.])

相信通過上面的講解與例子，你應(yīng)該對axis有了比較清楚的了解。個人認(rèn)為，如果沒有理解axis的真正含義，很難熟悉的運(yùn)用numpy進(jìn)行數(shù)據(jù)處理