pandas.DataFrame Series排序的使用(sort_values，sort_index)

更新時間：2023年02月23日 09:36:59 作者：餃子大人

本文主要介紹了pandas.DataFrame Series排序的使用(sort_values，sort_index)，文中通過示例代碼介紹的非常詳細，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

import pandas as pd

df = pd.read_csv('./data/17/sample_pandas_normal.csv')
print(df)
# ? ? ? name ?age state ?point
# 0 ? ?Alice ? 24 ? ?NY ? ? 64
# 1 ? ? ?Bob ? 42 ? ?CA ? ? 92
# 2 ?Charlie ? 18 ? ?CA ? ? 70
# 3 ? ? Dave ? 68 ? ?TX ? ? 70
# 4 ? ?Ellen ? 24 ? ?CA ? ? 88
# 5 ? ?Frank ? 30 ? ?NY ? ? 57

示例是pandas.DataFrame，但是pandas.Series也具有sort_values（）和sort_index（），因此用法是相同的。

按元素排序sort_values（）

使用sort_values（）方法根據(jù)元素值進行排序。

在第一個參數(shù)（by）中指定要排序的列的標簽（列名）。

df_s = df.sort_values('state')
print(df_s)
#       name  age state  point
# 1      Bob   42    CA     92
# 2  Charlie   18    CA     70
# 4    Ellen   24    CA     88
# 0    Alice   24    NY     64
# 5    Frank   30    NY     57
# 3     Dave   68    TX     70

升序，降序（參數(shù)ascending）

默認為升序。如果要使用降序，請將升序參數(shù)設(shè)置為False。

df_s = df.sort_values('state', ascending=False)
print(df_s)
#       name  age state  point
# 3     Dave   68    TX     70
# 0    Alice   24    NY     64
# 5    Frank   30    NY     57
# 1      Bob   42    CA     92
# 2  Charlie   18    CA     70
# 4    Ellen   24    CA     88

多列排序

如果將第一個參數(shù)指定為列表，則可以按多列排序。

從列表的后面開始順序排序的圖像。最后，它按列表中的第一列排序。

df_s = df.sort_values(['state', 'age'])
print(df_s)
# ? ? ? name ?age state ?point
# 2 ?Charlie ? 18 ? ?CA ? ? 70
# 4 ? ?Ellen ? 24 ? ?CA ? ? 88
# 1 ? ? ?Bob ? 42 ? ?CA ? ? 92
# 0 ? ?Alice ? 24 ? ?NY ? ? 64
# 5 ? ?Frank ? 30 ? ?NY ? ? 57
# 3 ? ? Dave ? 68 ? ?TX ? ? 70

df_s = df.sort_values(['age', 'state'])
print(df_s)
# ? ? ? name ?age state ?point
# 2 ?Charlie ? 18 ? ?CA ? ? 70
# 4 ? ?Ellen ? 24 ? ?CA ? ? 88
# 0 ? ?Alice ? 24 ? ?NY ? ? 64
# 5 ? ?Frank ? 30 ? ?NY ? ? 57
# 1 ? ? ?Bob ? 42 ? ?CA ? ? 92
# 3 ? ? Dave ? 68 ? ?TX ? ? 70

如果將升序參數(shù)指定為列表，則可以為每列選擇升序或降序。

df_s = df.sort_values(['age', 'state'], ascending=[True, False])
print(df_s)
#       name  age state  point
# 2  Charlie   18    CA     70
# 0    Alice   24    NY     64
# 4    Ellen   24    CA     88
# 5    Frank   30    NY     57
# 1      Bob   42    CA     92
# 3     Dave   68    TX     70

缺失值NaN的處理（參數(shù)na_position）

如果缺少值NaN，則默認情況下將對其排序。

df_nan = df.copy()
df_nan.iloc[:2, 1] = pd.np.nan
print(df_nan)
# ? ? ? name ? age state ?point
# 0 ? ?Alice ? NaN ? ?NY ? ? 64
# 1 ? ? ?Bob ? NaN ? ?CA ? ? 92
# 2 ?Charlie ?18.0 ? ?CA ? ? 70
# 3 ? ? Dave ?68.0 ? ?TX ? ? 70
# 4 ? ?Ellen ?24.0 ? ?CA ? ? 88
# 5 ? ?Frank ?30.0 ? ?NY ? ? 57

df_nan_s = df_nan.sort_values('age')
print(df_nan_s)
# ? ? ? name ? age state ?point
# 2 ?Charlie ?18.0 ? ?CA ? ? 70
# 4 ? ?Ellen ?24.0 ? ?CA ? ? 88
# 5 ? ?Frank ?30.0 ? ?NY ? ? 57
# 3 ? ? Dave ?68.0 ? ?TX ? ? 70
# 0 ? ?Alice ? NaN ? ?NY ? ? 64
# 1 ? ? ?Bob ? NaN ? ?CA ? ? 92

如果參數(shù)na_position =‘first’，它將被安排在開頭。

df_nan_s = df_nan.sort_values('age', na_position='first')
print(df_nan_s)
#       name   age state  point
# 0    Alice   NaN    NY     64
# 1      Bob   NaN    CA     92
# 2  Charlie  18.0    CA     70
# 4    Ellen  24.0    CA     88
# 5    Frank  30.0    NY     57
# 3     Dave  68.0    TX     70

要刪除缺少的值或?qū)⑵涮鎿Q為另一個值，請參閱以下文章。

Pandas刪除，替換并提取其中的缺失值NaN(dropna,fillna,isnull)

更改原始對象（參數(shù)inplace）

默認情況下，將返回一個新的排序?qū)ο?，但是如果inplace參數(shù)為True，則原始對象本身將被更改。

df.sort_values('state', inplace=True)
print(df)
#       name  age state  point
# 1      Bob   42    CA     92
# 2  Charlie   18    CA     70
# 4    Ellen   24    CA     88
# 0    Alice   24    NY     64
# 5    Frank   30    NY     57
# 3     Dave   68    TX     70

按行方向排序（參數(shù)axis）

與前面的示例一樣，默認排序為列（垂直）。

如果要按行方向排序，請將參數(shù)軸設(shè)置為1。其他參數(shù)與前面的示例相同。

由于如果數(shù)值和字符串混合使用會發(fā)生錯誤，因此在此處刪除字符串列，僅顯示數(shù)值列。有關(guān)drop（）方法，請參見以下文章。

Pandas.DataFrame刪除指定行和列（drop

df_d = df.drop(['name', 'state'], axis=1)
print(df_d)
# ? ?age ?point
# 1 ? 42 ? ? 92
# 2 ? 18 ? ? 70
# 4 ? 24 ? ? 88
# 0 ? 24 ? ? 64
# 5 ? 30 ? ? 57
# 3 ? 68 ? ? 70

df_d .sort_values(by=1, axis=1, ascending=False, inplace=True)
print(df_d)
# ? ?point ?age
# 1 ? ? 92 ? 42
# 2 ? ? 70 ? 18
# 4 ? ? 88 ? 24
# 0 ? ? 64 ? 24
# 5 ? ? 57 ? 30
# 3 ? ? 70 ? 68

按索引排序（行名/列名）sort_index（）

使用sort_index（）方法按索引（行名/列名）排序。

按行名索引排序

默認情況下，sort_index（）根據(jù)行名在列方向（垂直方向）上排序。

print(df)
# ? ? ? name ?age state ?point
# 1 ? ? ?Bob ? 42 ? ?CA ? ? 92
# 2 ?Charlie ? 18 ? ?CA ? ? 70
# 4 ? ?Ellen ? 24 ? ?CA ? ? 88
# 0 ? ?Alice ? 24 ? ?NY ? ? 64
# 5 ? ?Frank ? 30 ? ?NY ? ? 57
# 3 ? ? Dave ? 68 ? ?TX ? ? 70

df_s = df.sort_index()
print(df_s)
# ? ? ? name ?age state ?point
# 0 ? ?Alice ? 24 ? ?NY ? ? 64
# 1 ? ? ?Bob ? 42 ? ?CA ? ? 92
# 2 ?Charlie ? 18 ? ?CA ? ? 70
# 3 ? ? Dave ? 68 ? ?TX ? ? 70
# 4 ? ?Ellen ? 24 ? ?CA ? ? 88
# 5 ? ?Frank ? 30 ? ?NY ? ? 57

升序，降序（參數(shù)ascending）

與sort_values（）一樣，默認值為升序。如果要使用降序，請將升序參數(shù)設(shè)置為False。

df_s = df.sort_index(ascending=False)
print(df_s)
#       name  age state  point
# 5    Frank   30    NY     57
# 4    Ellen   24    CA     88
# 3     Dave   68    TX     70
# 2  Charlie   18    CA     70
# 1      Bob   42    CA     92
# 0    Alice   24    NY     64

更改原始對象（參數(shù)inplace）

與sort_values（）一樣，可以指定參數(shù)inplace。如果為True，則更改原始對象。

df.sort_index(inplace=True)
print(df)
#       name  age state  point
# 0    Alice   24    NY     64
# 1      Bob   42    CA     92
# 2  Charlie   18    CA     70
# 3     Dave   68    TX     70
# 4    Ellen   24    CA     88
# 5    Frank   30    NY     57

按列名列排序（參數(shù)axis）

與sort_values（）類似，如果設(shè)置了參數(shù)axis = 1，則根據(jù)列名在行方向（水平方向）上進行排序。可以像前面的示例一樣使用其他參數(shù)。

df_s = df.sort_index(axis=1)
print(df_s)
# ? ?age ? ? name ?point state
# 0 ? 24 ? ?Alice ? ? 64 ? ?NY
# 1 ? 42 ? ? ?Bob ? ? 92 ? ?CA
# 2 ? 18 ?Charlie ? ? 70 ? ?CA
# 3 ? 68 ? ? Dave ? ? 70 ? ?TX
# 4 ? 24 ? ?Ellen ? ? 88 ? ?CA
# 5 ? 30 ? ?Frank ? ? 57 ? ?NY

df.sort_index(axis=1, ascending=False, inplace=True)
print(df)
# ? state ?point ? ? name ?age
# 0 ? ?NY ? ? 64 ? ?Alice ? 24
# 1 ? ?CA ? ? 92 ? ? ?Bob ? 42
# 2 ? ?CA ? ? 70 ?Charlie ? 18
# 3 ? ?TX ? ? 70 ? ? Dave ? 68
# 4 ? ?CA ? ? 88 ? ?Ellen ? 24
# 5 ? ?NY ? ? 57 ? ?Frank ? 30

到此這篇關(guān)于pandas.DataFrame Series排序的使用(sort_values，sort_index)的文章就介紹到這了,更多相關(guān)pandas DataFrame Series排序內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: