Python之np.where()如何替換缺失值
np.where()替換缺失值
使用Python做數(shù)據(jù)分析時經(jīng)常需要替換缺失值。
np.where(條件,x,y)
np.where函數(shù)的結(jié)果是,如果“條件”為真,則x,否則y。
如下:
import pandas as pd import numpy as np df = pd.DataFrame(data={ 'A':[1,1,np.nan,2], 'B':[2,np.nan,4,5], 'C':[3,8,12,6] }) df A B C 0 1.0 2.0 3 1 1.0 NaN 8 2 NaN 4.0 12 3 2.0 5.0 6
使用np.where在A列缺失值處填C列的數(shù)
df['A'] = np.where(df['A'].isnull(),df['C'],df['A']) df A B C 0 1.0 2.0 3 1 1.0 NaN 8 2 12.0 4.012 3 2.0 5.0 6 ####################
使用data(DataFrame)的A列,填補(bǔ)df的A列
eg:
df['A'] = np.where(df['A'].isnull(),data['A'],df['A'])
np.where()函數(shù)
調(diào)用方式及參數(shù)說明
numpy.where(condition[, x, y])
各個參數(shù)意義:
condition
:類似數(shù)組的對象,布爾值x, y
:類似數(shù)組的對象,給出值的地方,如果condition
為True
,從x
中選取值,condition
為False
,從y
中選取值。
有返回值,返回一個滿足條件時取x
中對應(yīng)的值,不滿足條件時取 y
中對應(yīng)值的數(shù)組。
注意:
這里的 condition
,x
,y
只是為了表示以及說明時的必要,并不是真正意義上的關(guān)鍵字。
示例1:獲取一維數(shù)組中最大元素所處位置
這里我們給出使用 np.where()
函數(shù)獲取一維數(shù)組中最大值對應(yīng)位置的例子。
# -*- coding:utf-8 -*- """ author: 15025 time: 2020/12/30 20:27 software: PyCharm """ import numpy as np class Debug: @staticmethod def mainProgram(): array = np.array([0, 1, 2, 3, 5, 4]) array_ = np.where(array == np.max(array)) print("array_的值為:") print(array_) if __name__ == "__main__": main = Debug() main.mainProgram() """ array_的值為: (array([4], dtype=int64),) """
這里 array_
的結(jié)果為 4
,4
表示一維數(shù)組中最大元素所對應(yīng)的索引值。
示例2:獲取二維數(shù)組中最大元素所處位置
# -*- coding:utf-8 -*- """ author: 15025 time: 2020/12/30 20:27 software: PyCharm """ import numpy as np class Debug: @staticmethod def mainProgram(): array = np.array([[0, 1, 2, 3, 5, 4, 5], [0, 1, 2, 3, 4, 5, 5]]) array_ = np.where(array == np.max(array)) print("array_的值為:") print(array_) if __name__ == "__main__": main = Debug() main.mainProgram() """ array_的值為: (array([0, 0, 1, 1], dtype=int64), array([4, 6, 5, 6], dtype=int64)) """
首先通過觀察不難發(fā)現(xiàn),該二維數(shù)組中的最大值為 5
,且一共有 4
個最大元素存在,因此,最終的結(jié)果應(yīng)該存在 4
組數(shù)據(jù)表示這四個元素的位置。
結(jié)果中的 array([0, 0, 1, 1], dtype=int64)
表示數(shù)組中的 y
索引值,array([4, 6, 5, 6], dtype=int64)
表示 x
的索引值。
示例3:獲取三維數(shù)組中最大元素所處位置
# -*- coding:utf-8 -*- """ author: 15025 time: 2020/12/30 20:27 software: PyCharm """ import numpy as np class Debug: @staticmethod def mainProgram(): array = np.array([[[0, 1], [0, 1]], [[1, 2], [1, 2]], [[1, 3], [1, 3]]]) array_ = np.where(array == np.max(array)) print("array_的值為:") print(array_) if __name__ == "__main__": main = Debug() main.mainProgram() """ array_的值為: (array([2, 2], dtype=int64), array([0, 1], dtype=int64), array([1, 1], dtype=int64)) """
顯而易見,三維結(jié)果同二維的情況類似,只是多了一個維度,且輸出結(jié)果三組數(shù)據(jù)分別對應(yīng) z,y,x
坐標(biāo),其他的這里不做過多解釋了。
示例4:Condition 方法
# -*- coding:utf-8 -*- """ author: 15025 time: 2020/12/30 20:27 software: PyCharm """ import numpy as np class Debug: @staticmethod def mainProgram(): array = np.where([[True, False], [True, True]], [[1, 2], [3, 4]], [[9, 8], [7, 6]]) print("array的值為:") print(array) if __name__ == "__main__": main = Debug() main.mainProgram() """ array的值為: [[1 8] [3 4]] """
我們可以看到,這里的 [[True, False], [True, True]]
相當(dāng)于我們說的 condition
,[[1, 2], [3, 4]]
相當(dāng)于 x
,[[9, 8], [7, 6]]
相當(dāng)于 y
,當(dāng)我們的 conditon
為 False
時從y
中取出了數(shù)值 8
,其他數(shù)值全部從 x
中的對應(yīng)位置取出。最終我們得到了上述結(jié)果。
示例5:更改二維數(shù)組中符合要求的數(shù)據(jù)
這里我們將二維數(shù)組中值大于等于 3
的元素更改為 8
。
顯然,值大于等于 3
的元素對應(yīng)倒數(shù)第二個元素和最后一個元素。
import numpy as np arr_2d = np.array([[1, 2], [3, 4]]) pos_y, pos_x = np.where(arr_2d >= 3) print(f"np.where() 函數(shù)得到的索引值元胞的形狀為: {arr_2d[np.where(arr_2d >= 3)].shape}") print(f"np.where() 函數(shù)得到的索引值元胞的形狀為: {arr_2d[pos_y, pos_x].shape}") print(f"二維數(shù)組 arr_2d 中滿足要求的元素為: {arr_2d[pos_y, pos_x]}") arr_2d[pos_y, pos_x] = 8 print("修改元素后二維數(shù)組中存放的元素值為:") print(arr_2d) """ result: np.where() 函數(shù)得到的索引值元胞的形狀為: (2,) np.where() 函數(shù)得到的索引值元胞的形狀為: (2,) 二維數(shù)組 arr_2d 中滿足要求的元素為: [3 4] 修改元素后二維數(shù)組中存放的元素值為: [[1 2] [8 8]] """
這里需要注意的一點(diǎn)是,當(dāng)我們使用 np.where()
函數(shù)獲取對應(yīng)二維數(shù)組中滿足要求的元素值的索引后,再通過 arr_2d[pos_y, pos_x]
獲取數(shù)組中滿足要求的元素時,獲取到的滿足要求的元素會被自動展平存放在一個一維數(shù)組中。
總結(jié)
以上為個人經(jīng)驗(yàn),希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
一個簡單的python爬蟲程序 爬取豆瓣熱度Top100以內(nèi)的電影信息
這篇文章主要為大家詳細(xì)介紹了一個簡單的python爬蟲程序,爬取豆瓣熱度Top100以內(nèi)的電影信息,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-04-04python中字符串?dāng)?shù)組逆序排列方法總結(jié)
在本篇文章里小編給大家整理了關(guān)于python中字符串?dāng)?shù)組如何逆序排列的相關(guān)知識點(diǎn),需要的朋友們學(xué)習(xí)下。2019-06-06Python 如何手動編寫一個自己的LRU緩存裝飾器的方法實(shí)現(xiàn)
本文主要介紹了Python如何手動編寫一個自己的LRU緩存裝飾器,文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-12-12Python網(wǎng)絡(luò)編程之Socket和HTTP協(xié)議詳解
在當(dāng)今互聯(lián)網(wǎng)時代,網(wǎng)絡(luò)編程是程序員不可或缺的一項(xiàng)技能,本文將介紹Python中兩種主要的網(wǎng)絡(luò)編程方式:Socket編程和基于HTTP協(xié)議的網(wǎng)絡(luò)編程,希望對大家有所幫助2024-04-04Python實(shí)現(xiàn)對照片中的人臉進(jìn)行顏值預(yù)測
今天給大家?guī)淼氖顷P(guān)于Python實(shí)戰(zhàn)的相關(guān)知識,文章圍繞如何用Python實(shí)現(xiàn)對照片中的人臉進(jìn)行顏值預(yù)測展開,文中有非常詳細(xì)的介紹及代碼示例,需要的朋友可以參考下2021-06-06Django?celery的替代品Dramatiq使用特性詳解
這篇文章主要為大家介紹了Django?celery的替代品Dramatiq使用特性詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-06-06Python創(chuàng)建對稱矩陣的方法示例【基于numpy模塊】
這篇文章主要介紹了Python創(chuàng)建對稱矩陣的方法,結(jié)合實(shí)例形式分析了Python基于numpy模塊實(shí)現(xiàn)矩陣運(yùn)算的相關(guān)操作技巧,需要的朋友可以參考下2017-10-10