快捷導(dǎo)航

在pandas多重索引multiIndex中選定指定索引的行方法

更新時(shí)間：2018年11月16日 10:40:25 作者：PIPIXIU

今天小編就為大家分享一篇在pandas多重索引multiIndex中選定指定索引的行方法，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧

在multiIndex中選定指定索引的行

我們?cè)谟胮andas類似groupby來(lái)使用多重index時(shí)，有時(shí)想要對(duì)多個(gè)level中的某個(gè)index對(duì)應(yīng)的行進(jìn)行操作，就需要在dataframe中找到該index對(duì)應(yīng)的行，在單層index中我們可以方便的使用df.loc[index]來(lái)選擇，在多重Index中我們可以利用的類似的思路，然而其中也有一些小坑，記錄如下。

1 index為有序的

1.1 創(chuàng)建測(cè)試數(shù)據(jù)

首先創(chuàng)建一個(gè)dataframe數(shù)據(jù)

df = pd.DataFrame({'class':['A','A','A','B','B','B','C','C'],
   'id':['a','b','c','a','b','c','a','b'],
   'value':[1,2,3,4,5,6,7,8]})

df中內(nèi)容如下圖：

pandas multiIndex選定指定索引的行

1.2 設(shè)置multiIndex

通過(guò)set_index設(shè)為多重索引

df = df.set_index(['class','id'])

設(shè)置索引后效果：

pandas multiIndex選定指定索引的行

1.3 切片篩選index

這里同樣使用loc定位

df.loc[('A',slice(None)),:]

各參數(shù)的解釋如下：

loc[(a,b),c]中第一個(gè)參數(shù)元組為索引內(nèi)容，a為level0索引對(duì)應(yīng)的內(nèi)容，b為level1索引對(duì)應(yīng)的內(nèi)容

因?yàn)閐f是一個(gè)dataframe，所以要用c來(lái)指定列

這里‘A'，指選擇class中的A類

slice(None), 是Python中的切片操作，這里用來(lái)選擇任意的id，要注意！不能使用‘:'來(lái)指定任意index

‘:',用來(lái)指定dataframe任意的列

執(zhí)行后的結(jié)果如下：

pandas multiIndex選定指定索引的行

同樣，如果想只保留id中的'a'，則可以使用：

df.loc[(slice(None),'a'),:]

2 index無(wú)序

前面的例子對(duì)應(yīng)的index列為數(shù)字或字母，是有序的，接下來(lái)我們看看index列為中文的情況。

2.1 創(chuàng)建無(wú)序測(cè)試數(shù)據(jù)

df2 = pd.DataFrame({'課程':['語(yǔ)文','語(yǔ)文','數(shù)學(xué)','數(shù)學(xué)'],'得分':['最高','最低','最高','最低'],'分值':[90,50,100,60]})
df2 = df2.set_index(['課程','得分'])

pandas multiIndex選定指定索引的行

2.2 嘗試切片選擇index

df2.loc[('語(yǔ)文',slice(None)),:]

我們進(jìn)行同樣的操作，這時(shí)會(huì)發(fā)現(xiàn)提示出錯(cuò)：

UnsortedIndexError: 'MultiIndex Slicing requires the index to be fully lexsorted tuple len (2), lexsort depth (0)'

這是因?yàn)榇藭r(shí)的index無(wú)法進(jìn)行排序，在pandas文檔中提到：Furthermore if you try to index something that is not fully lexsorted, this can raise:

我們可以通過(guò) df2.index.is_lexsorted()來(lái)檢查index是否有序，

In[1]: df2.index.is_lexsorted()
out[1]: False

接下來(lái)，我們嘗試對(duì)Index進(jìn)行排序。（排序時(shí)要在level里指定index名）

2.3 對(duì)index排序后切片選擇index

df2 = df2.sort_index(level='課程')

df2.loc[('語(yǔ)文',slice(None)),:]

pandas multiIndex選定指定索引的行

得到了我們想要的結(jié)果。

參考文獻(xiàn)：pandas-docs-MultiIndex / Advanced Indexing

以上這篇在pandas多重索引multiIndex中選定指定索引的行方法就是小編分享給大家的全部?jī)?nèi)容了，希望能給大家一個(gè)參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

在pandas多重索引multiIndex中選定指定索引的行方法

相關(guān)文章

最新評(píng)論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具