欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python Pandas實(shí)現(xiàn)數(shù)據(jù)分組求平均值并填充nan的示例

 更新時(shí)間:2019年07月04日 10:18:48   作者:好男孩朋友99  
今天小編就為大家分享一篇Python Pandas實(shí)現(xiàn)數(shù)據(jù)分組求平均值并填充nan的示例,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧

Python實(shí)現(xiàn)按某一列關(guān)鍵字分組,并計(jì)算各列的平均值,并用該值填充該分類該列的nan值。

DataFrame數(shù)據(jù)格式

fillna方式實(shí)現(xiàn)

groupby方式實(shí)現(xiàn)

DataFrame數(shù)據(jù)格式

以下是數(shù)據(jù)存儲形式:

fillna方式實(shí)現(xiàn)

1、按照industryName1列,篩選出業(yè)績

2、篩選出相同行業(yè)的Series

3、計(jì)算平均值mean,采用fillna函數(shù)填充

4、append到新DataFrame中

5、循環(huán)遍歷行業(yè)名稱,完成2,3,4步驟

factordatafillna = pd.DataFrame()
industrys = newfactordata1.industryName1.unique()
for ind in industrys:
  t = newfactordata1.industryName1 == ind
  a = newfactordata1[t].fillna(newfactordata1[t].mean())
  factordatafillna = factordatafillna.append(a)

groupby方式實(shí)現(xiàn)

采用groupby計(jì)算,詳細(xì)見代碼注釋

df = pd.DataFrame({'code':[1,2,3,4,5,6,7,8],
          'value':[np.nan,5,7,8,9,10,11,12],          
          'value2':[5,np.nan,7,np.nan,9,10,11,12],
          'indstry':['農(nóng)業(yè)1','農(nóng)業(yè)1','農(nóng)業(yè)1','農(nóng)業(yè)2','農(nóng)業(yè)2','農(nóng)業(yè)4','農(nóng)業(yè)2','農(nóng)業(yè)3']},
          columns=['code','value','value2','indstry'],
          index=list('ABCDEFGH'))

# 只留下需要處理的列
cols = [col for col in df.columns if col not in['code','indstry']]
# 分組的列
gp_col = 'indstry'
# 查詢nan的列
df_na = df[cols].isna()
# 根據(jù)分組計(jì)算平均值
df_mean = df.groupby(gp_col)[cols].mean()

print(df)

# 依次處理每一列
for col in cols:
  na_series = df_na[col]
  names = list(df.loc[na_series,gp_col])   

  t = df_mean.loc[names,col]
  t.index = df.loc[na_series,col].index

  # 相同的index進(jìn)行賦值   
  df.loc[na_series,col] = t

print(df)
code value value2 indstry
A   1  NaN   5.0   農(nóng)業(yè)1
B   2  5.0   NaN   農(nóng)業(yè)1
C   3  7.0   7.0   農(nóng)業(yè)1
D   4  8.0   NaN   農(nóng)業(yè)2
E   5  9.0   9.0   農(nóng)業(yè)2
F   6  10.0  10.0   農(nóng)業(yè)4
G   7  11.0  11.0   農(nóng)業(yè)2
H   8  12.0  12.0   農(nóng)業(yè)3
  code value value2 indstry
A   1  6.0   5.0   農(nóng)業(yè)1
B   2  5.0   6.0   農(nóng)業(yè)1
C   3  7.0   7.0   農(nóng)業(yè)1
D   4  8.0  10.0   農(nóng)業(yè)2
E   5  9.0   9.0   農(nóng)業(yè)2
F   6  10.0  10.0   農(nóng)業(yè)4
G   7  11.0  11.0   農(nóng)業(yè)2
H   8  12.0  12.0   農(nóng)業(yè)3

以上這篇Python Pandas實(shí)現(xiàn)數(shù)據(jù)分組求平均值并填充nan的示例就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • 詳解Python中正則匹配TAB及空格的小技巧

    詳解Python中正則匹配TAB及空格的小技巧

    這篇文章主要介紹了詳解Python中正則匹配TAB及空格的小技巧,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-07-07
  • Win10 安裝PyCharm2019.1.1(圖文教程)

    Win10 安裝PyCharm2019.1.1(圖文教程)

    這篇文章主要介紹了Win10 安裝PyCharm2019.1.1(圖文教程),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-09-09
  • Pandas 稀疏數(shù)據(jù)結(jié)構(gòu)的實(shí)現(xiàn)

    Pandas 稀疏數(shù)據(jù)結(jié)構(gòu)的實(shí)現(xiàn)

    如果數(shù)據(jù)中有很多NaN的值,存儲起來就會浪費(fèi)空間。為了解決這個(gè)問題,Pandas引入了一種叫做Sparse data的結(jié)構(gòu),來有效的存儲這些NaN的值,本文就來詳細(xì)的介紹了一下,感興趣的可以了解一下
    2021-07-07
  • 解決Python運(yùn)算符重載的問題

    解決Python運(yùn)算符重載的問題

    這篇文章主要介紹了解決Python運(yùn)算符重載的問題,具有很好的參考價(jià)值,希望對大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2021-05-05
  • Python掃描端口的實(shí)現(xiàn)

    Python掃描端口的實(shí)現(xiàn)

    這篇文章主要介紹了Python掃描端口的實(shí)現(xiàn),本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2021-01-01
  • python markdown轉(zhuǎn)html自定義實(shí)現(xiàn)工具解析

    python markdown轉(zhuǎn)html自定義實(shí)現(xiàn)工具解析

    Python-Markdown2 是一個(gè) Python 庫,用于將 Markdown 文本轉(zhuǎn)換為 HTML,它是對標(biāo)準(zhǔn) Markdown 語法的擴(kuò)展,提供了一些額外的功能和選項(xiàng),同時(shí)還兼容標(biāo)準(zhǔn) Markdown,用它可以方便地生成漂亮的文檔、博客文章、項(xiàng)目文檔等
    2024-01-01
  • Python?selenium把歌詞評論做成詞云圖

    Python?selenium把歌詞評論做成詞云圖

    大家好,本篇文章主要講的是Python?selenium把歌詞評論做成詞云圖,感興趣的同學(xué)趕快來看一看吧,對你有幫助的話記得收藏一下
    2022-01-01
  • 微信跳一跳python輔助腳本(總結(jié))

    微信跳一跳python輔助腳本(總結(jié))

    本篇文章為大家整理了關(guān)于微信跳一跳的輔助腳本內(nèi)容,這次我們給大家整理的是關(guān)于python的腳本內(nèi)容,一起來學(xué)習(xí)下。
    2018-01-01
  • Python中利用算法優(yōu)化性能的技巧分享

    Python中利用算法優(yōu)化性能的技巧分享

    這篇文章主要為大家詳細(xì)介紹了Python中12個(gè)可以利用算法優(yōu)化性能的技巧,文中的示例代碼簡潔易懂,具有一定的借鑒價(jià)值,有需要的小伙伴可以了解下
    2025-04-04
  • Python?Melt函數(shù)將寬格式的數(shù)據(jù)表轉(zhuǎn)換為長格式

    Python?Melt函數(shù)將寬格式的數(shù)據(jù)表轉(zhuǎn)換為長格式

    在數(shù)據(jù)處理和清洗中,melt函數(shù)是Pandas庫中一個(gè)強(qiáng)大而靈活的工具,它的主要功能是將寬格式的數(shù)據(jù)表轉(zhuǎn)換為長格式,從而更方便進(jìn)行分析和可視化,本文將深入探討melt函數(shù)的用法、參數(shù)解析以及實(shí)際應(yīng)用場景
    2023-12-12

最新評論