numpy模塊中axis的理解與使用
首先為什么會(huì)有axis這個(gè)概念?
因?yàn)樵趎umpy模塊中,大多數(shù)處理的是矩陣或者多維數(shù)組,同時(shí),對(duì)多維數(shù)組或者矩陣的操作有多種可能,為了幫助實(shí)現(xiàn)對(duì)數(shù)組或矩陣各種各樣的功能,就有了axis
下面舉個(gè)例子,選取不同的axis,對(duì)二維數(shù)組進(jìn)行sum,mean,min,max的操作
>>> import numpy as np >>> arr=np.arange(16).reshape(2,4,2) >>> arr array([[[ 0, 1], [ 2, 3], [ 4, 5], [ 6, 7]], [[ 8, 9], [10, 11], [12, 13], [14, 15]]])
axis的作用即如何理解
numpy是python進(jìn)行科學(xué)計(jì)算必不可少的模塊,隨著深度學(xué)習(xí)越來越火,numpy也越來越流行。了解numpy的人知道,在numpy中,有很多的函數(shù)都涉及到axis,很多函數(shù)根據(jù)axis的取值不同,得到的結(jié)果也完全不同。可以說,axis讓numpy的多維數(shù)組變的更加靈活,但也讓numpy變得越發(fā)難以理解。這里通過詳細(xì)的例子來學(xué)習(xí)下,axis到底是什么,它在numpy中的作用到底如何。
為什么會(huì)有axis這個(gè)東西,原因很簡(jiǎn)單:numpy是針對(duì)矩陣或者多為數(shù)組進(jìn)行運(yùn)算的,而在多維數(shù)組中,對(duì)數(shù)據(jù)的操作有太多的可能,我們先來看一個(gè)例子。比如我們有一個(gè)二維數(shù)組:
>>> import numpy as np >>> data = np.array([ ... [1,2,1], ... [0,3,1], ... [2,1,4], ... [1,3,1]])
這個(gè)數(shù)組代表了樣本數(shù)據(jù)的特征,其中每一行代表一個(gè)樣本的三個(gè)特征,每一列是不同樣本的特征。如果在分析樣本的過程中需要對(duì)每個(gè)樣本的三個(gè)特征求和,該如何處理?簡(jiǎn)單:
>>> np.sum(data, axis=1) array([4, 4, 7, 5])
那如果想求每種特征的最小值,該如何處理?也簡(jiǎn)單:
>>> np.min(data, axis=0) array([0, 1, 1])
又如果想得知所有樣本所有特征的平均值呢?還是很簡(jiǎn)單:
>>> np.average(data) 1.6666666666666667
由此可以看出,通過不同的axis,numpy會(huì)沿著不同的方向進(jìn)行操作:如果不設(shè)置,那么對(duì)所有的元素操作;如果axis=0,則沿著縱軸進(jìn)行操作;axis=1,則沿著橫軸進(jìn)行操作。但這只是簡(jiǎn)單的二位數(shù)組,如果是多維的呢?可以總結(jié)為一句話:設(shè)axis=i,則numpy沿著第i個(gè)下標(biāo)變化的放下進(jìn)行操作。例如剛剛的例子,可以將表示為:data =[[a00, a01],[a10,a11]],所以axis=0時(shí),沿著第0個(gè)下標(biāo)變化的方向進(jìn)行操作,也就是a00->a10, a01->a11,也就是縱坐標(biāo)的方向,axis=1時(shí)也類似。下面我們舉一個(gè)四維的求sum的例子來驗(yàn)證一下:
>>> data = np.random.randint(0, 5, [4,3,2,3]) >>> data array([[[[4, 1, 0], [4, 3, 0]], [[1, 2, 4], [2, 2, 3]], [[4, 3, 3], [4, 2, 3]]], [[[4, 0, 1], [1, 1, 1]], [[0, 1, 0], [0, 4, 1]], [[1, 3, 0], [0, 3, 0]]], [[[3, 3, 4], [0, 1, 0]], [[1, 2, 3], [4, 0, 4]], [[1, 4, 1], [1, 3, 2]]], [[[0, 1, 1], [2, 4, 3]], [[4, 1, 4], [1, 4, 1]], [[0, 1, 0], [2, 4, 3]]]])
當(dāng)axis=0時(shí),numpy驗(yàn)證第0維的方向來求和,也就是第一個(gè)元素值=a0000+a1000+a2000+a3000=11,第二個(gè)元素=a0001+a1001+a2001+a3001=5,同理可得最后的結(jié)果如下:
>>> data.sum(axis=0) array([[[11, 5, 6], [ 7, 9, 4]], [[ 6, 6, 11], [ 7, 10, 9]], [[ 6, 11, 4], [ 7, 12, 8]]])
當(dāng)axis=3時(shí),numpy驗(yàn)證第3維的方向來求和,也就是第一個(gè)元素值=a0000+a0001+a0002=5,第二個(gè)元素=a0010+a0011+a0012=7,同理可得最后的結(jié)果如下:
>>> data.sum(axis=3) array([[[ 5, 7], [ 7, 7], [10, 9]], [[ 5, 3], [ 1, 5], [ 4, 3]], [[10, 1], [ 6, 8], [ 6, 6]], [[ 2, 9], [ 9, 6], [ 1, 9]]])
使用axis的相關(guān)函數(shù)
在numpy中,使用的axis的地方非常多,處理上文已經(jīng)提到的average、max、min、sum,比較常見的還有sort和prod,下面分別舉幾個(gè)例子看一下:
sort
>>> data = np.random.randint(0, 5, [3,2,3]) >>> data array([[[4, 2, 0], [0, 0, 4]], [[2, 1, 1], [1, 0, 2]], [[3, 0, 4], [0, 1, 3]]]) >>> np.sort(data) ## 默認(rèn)對(duì)最大的axis進(jìn)行排序,這里即是axis=2 array([[[0, 2, 4], [0, 0, 4]], [[1, 1, 2], [0, 1, 2]], [[0, 3, 4], [0, 1, 3]]]) >>> np.sort(data, axis=0) # 沿著第0維進(jìn)行排序,原先的a000->a100->a200轉(zhuǎn)變?yōu)閍100->a200->a000 array([[[2, 0, 0], [0, 0, 2]], [[3, 1, 1], [0, 0, 3]], [[4, 2, 4], [1, 1, 4]]]) >>> np.sort(data, axis=1) # 沿著第1維進(jìn)行排序 array([[[0, 0, 0], [4, 2, 4]], [[1, 0, 1], [2, 1, 2]], [[0, 0, 3], [3, 1, 4]]]) >>> np.sort(data, axis=2) # 沿著第2維進(jìn)行排序 array([[[0, 2, 4], [0, 0, 4]], [[1, 1, 2], [0, 1, 2]], [[0, 3, 4], [0, 1, 3]]]) >>> np.sort(data, axis=None) # 對(duì)全部數(shù)據(jù)進(jìn)行排序 array([0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 3, 3, 4, 4, 4])
prod(即product,乘積)
>>> np.prod([[1.,2.],[3.,4.]]) 24.0 >>> np.prod([[1.,2.],[3.,4.]], axis=1) array([ 2., 12.]) >>> np.prod([[1.,2.],[3.,4.]], axis=0) array([ 3., 8.])
相信通過上面的講解與例子,你應(yīng)該對(duì)axis有了比較清楚的了解。個(gè)人認(rèn)為,如果沒有理解axis的真正含義,很難熟悉的運(yùn)用numpy進(jìn)行數(shù)據(jù)處理
總結(jié)
到此這篇關(guān)于numpy模塊中axis的理解與使用的文章就介紹到這了,更多相關(guān)numpy模塊axis內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python2.7實(shí)現(xiàn)復(fù)制大量文件及文件夾資料
這篇文章主要為大家詳細(xì)介紹了python2.7實(shí)現(xiàn)復(fù)制大量文件及文件夾資料,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-08-08Python中常見的反爬機(jī)制及其破解方法總結(jié)
今天給大家?guī)淼奈恼率顷P(guān)于Python的相關(guān)知識(shí),文章圍繞著Python中常見的反爬機(jī)制及其破解方法展開,文中有非常詳細(xì)的介紹,需要的朋友可以參考下2021-06-06numpy.std() 計(jì)算矩陣標(biāo)準(zhǔn)差的方法
今天小編就為大家分享一篇numpy.std() 計(jì)算矩陣標(biāo)準(zhǔn)差的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-07-07用Python實(shí)現(xiàn)的等差數(shù)列方式
這篇文章主要介紹了用Python實(shí)現(xiàn)的等差數(shù)列方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-12-12將pip源更換到國(guó)內(nèi)鏡像的詳細(xì)步驟
這篇文章主要介紹了將pip源更換到國(guó)內(nèi)鏡像的詳細(xì)步驟,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2019-04-04Django 忘記管理員或忘記管理員密碼 重設(shè)登錄密碼的方法
今天小編就為大家分享一篇Django 忘記管理員或忘記管理員密碼 重設(shè)登錄密碼的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-05-05Python函數(shù)的周期性執(zhí)行實(shí)現(xiàn)方法
這篇文章主要介紹了Python函數(shù)的周期性執(zhí)行實(shí)現(xiàn)方法,涉及Python使用sched模塊實(shí)現(xiàn)函數(shù)周期性調(diào)度觸發(fā)的相關(guān)技巧,需要的朋友可以參考下2016-08-08