欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

pandas組內(nèi)排序,并在每個分組內(nèi)按序打上序號的操作

 更新時間:2021年03月26日 09:01:18   作者:Automation_走天涯  
這篇文章主要介紹了pandas組內(nèi)排序,并在每個分組內(nèi)按序打上序號的操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧

問題:

pandas組內(nèi)排序,并在每個分組內(nèi)按序打上序號

描述:

pandas dataframe 對dep_id組內(nèi)的salary排序。希望給下面原本只有前三列的dataframe,添加上第四列。

等價于sql里的排序函數(shù) row_number() over() 功能

假設(shè)我已經(jīng)建好了僅有前三列的dataframe,數(shù)據(jù)集命名為 MyData,

解決方案如下:

MyData['sort_id'] = MyData['salary'].groupby(MyData['dep_id']).rank()

結(jié)果如下:

補充:Pandas.DataFrame實現(xiàn)分組、排序并且為分組插入排名

1. 示例數(shù)據(jù)(各班級學(xué)生得分)

import pandas as pd
data_dict = {"name": 
       ["Rose", "Jack", "Tom", "Kyle", "Jery", "Adam", "Bill", "David", "Denny", "Evan"],
      "class": [1, 2, 3, 1, 2, 3, 1, 2, 3, 1],
      "score": [88, 92, 38, 98, 22, 65, 45, 53, 97, 100]}
df = pd.DataFrame(data=data_dict)
df

2. 按班級分組

df = df.groupby('class', sort=False)\
    .apply(lambda x:x.sort_values("score", ascending=False))\
    .reset_index(drop=True)
df

3. 給各分組班級增加排名列

df["rank"] = None
# 標(biāo)識班級
flag = df.loc[0].values[1]
rank = 0
for i in range(len(df)):
  temp = df.loc[i].values[1]
  if (temp == flag).all():
    # 同一班級
    rank += 1
  else:
    # 不同班級,重新計算排名
    flag = temp
    rank = 1
  df.loc[i, "rank"] = rank
df

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。

相關(guān)文章

最新評論