Pandas如何通過np.array函數或tolist方法去掉數據中的index
引言
在做 pandas
數據處理的時候遇到了一個問題,獲取到的數據總是會帶有 dateframe
的格式,即總會有 index
顯示出來。
為了去掉這些顯示,我們可以使用 np.array()
函數進行數據類型的轉換。
正文
比如,對于以下的數據形式:
正常情況下,我們可以使用如下代碼獲取 layer1
對應的列數據:
import pandas as pd data = pd.read_excel('output.xlsx') print(data['layer1'][2:]) """ 2 a 3 c Name: layer1, dtype: object """
可以看到,通過這種方式獲取到的數據左側會有 index
顯示,末尾也會有 name
顯示,為了不出現 index
和 name
這些不必要的額外信息,我們可以使用 np.array()
作用在 data['layer1'][2:]
上。
修改后得到的結果如下:
import numpy as np import pandas as pd data = pd.read_excel('output.xlsx') print(np.array(data['layer1'][2:])) """ result: ['a' 'c'] """
至此,我們說明了通過使用 np.array()
,可以去掉數據中的 index
說明部分。
當然,我們也可以使用 pandas
中自帶的 tolist()
方法去掉 index
部分。
import pandas as pd data = pd.read_excel('output.xlsx') print(data['layer1'][2:].tolist()) """ result: ['a', 'c'] """
總結
以上為個人經驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
Python排序方法中sort和sorted的區(qū)別詳解
在python中常用的排序函數就是sort()和sorted()這兩個函數,使用 sort() 或內建函數 sorted() 對列表進行排序,本文將詳細介紹sorted和sort兩者之間的區(qū)別,感興趣的可以了解一下2023-08-08