Python之np.where()如何替換缺失值
np.where()替換缺失值
使用Python做數(shù)據(jù)分析時(shí)經(jīng)常需要替換缺失值。
np.where(條件,x,y)
np.where函數(shù)的結(jié)果是,如果“條件”為真,則x,否則y。
如下:
import pandas as pd
import numpy as np
df = pd.DataFrame(data={
'A':[1,1,np.nan,2],
'B':[2,np.nan,4,5],
'C':[3,8,12,6]
})
df
A B C
0 1.0 2.0 3
1 1.0 NaN 8
2 NaN 4.0 12
3 2.0 5.0 6使用np.where在A列缺失值處填C列的數(shù)
df['A'] = np.where(df['A'].isnull(),df['C'],df['A'])
df
A B C
0 1.0 2.0 3
1 1.0 NaN 8
2 12.0 4.012
3 2.0 5.0 6
####################使用data(DataFrame)的A列,填補(bǔ)df的A列
eg:
df['A'] = np.where(df['A'].isnull(),data['A'],df['A'])
np.where()函數(shù)
調(diào)用方式及參數(shù)說明
numpy.where(condition[, x, y])
各個(gè)參數(shù)意義:
condition:類似數(shù)組的對(duì)象,布爾值x, y:類似數(shù)組的對(duì)象,給出值的地方,如果condition為True,從x中選取值,condition為False,從y中選取值。
有返回值,返回一個(gè)滿足條件時(shí)取x中對(duì)應(yīng)的值,不滿足條件時(shí)取 y 中對(duì)應(yīng)值的數(shù)組。
注意:
這里的 condition,x,y只是為了表示以及說明時(shí)的必要,并不是真正意義上的關(guān)鍵字。
示例1:獲取一維數(shù)組中最大元素所處位置
這里我們給出使用 np.where() 函數(shù)獲取一維數(shù)組中最大值對(duì)應(yīng)位置的例子。
# -*- coding:utf-8 -*-
"""
author: 15025
time: 2020/12/30 20:27
software: PyCharm
"""
import numpy as np
class Debug:
@staticmethod
def mainProgram():
array = np.array([0, 1, 2, 3, 5, 4])
array_ = np.where(array == np.max(array))
print("array_的值為:")
print(array_)
if __name__ == "__main__":
main = Debug()
main.mainProgram()
"""
array_的值為:
(array([4], dtype=int64),)
"""
這里 array_ 的結(jié)果為 4,4 表示一維數(shù)組中最大元素所對(duì)應(yīng)的索引值。
示例2:獲取二維數(shù)組中最大元素所處位置
# -*- coding:utf-8 -*-
"""
author: 15025
time: 2020/12/30 20:27
software: PyCharm
"""
import numpy as np
class Debug:
@staticmethod
def mainProgram():
array = np.array([[0, 1, 2, 3, 5, 4, 5], [0, 1, 2, 3, 4, 5, 5]])
array_ = np.where(array == np.max(array))
print("array_的值為:")
print(array_)
if __name__ == "__main__":
main = Debug()
main.mainProgram()
"""
array_的值為:
(array([0, 0, 1, 1], dtype=int64), array([4, 6, 5, 6], dtype=int64))
"""
首先通過觀察不難發(fā)現(xiàn),該二維數(shù)組中的最大值為 5,且一共有 4 個(gè)最大元素存在,因此,最終的結(jié)果應(yīng)該存在 4 組數(shù)據(jù)表示這四個(gè)元素的位置。
結(jié)果中的 array([0, 0, 1, 1], dtype=int64) 表示數(shù)組中的 y 索引值,array([4, 6, 5, 6], dtype=int64) 表示 x 的索引值。
示例3:獲取三維數(shù)組中最大元素所處位置
# -*- coding:utf-8 -*-
"""
author: 15025
time: 2020/12/30 20:27
software: PyCharm
"""
import numpy as np
class Debug:
@staticmethod
def mainProgram():
array = np.array([[[0, 1], [0, 1]],
[[1, 2], [1, 2]],
[[1, 3], [1, 3]]])
array_ = np.where(array == np.max(array))
print("array_的值為:")
print(array_)
if __name__ == "__main__":
main = Debug()
main.mainProgram()
"""
array_的值為:
(array([2, 2], dtype=int64), array([0, 1], dtype=int64), array([1, 1], dtype=int64))
"""
顯而易見,三維結(jié)果同二維的情況類似,只是多了一個(gè)維度,且輸出結(jié)果三組數(shù)據(jù)分別對(duì)應(yīng) z,y,x 坐標(biāo),其他的這里不做過多解釋了。
示例4:Condition 方法
# -*- coding:utf-8 -*-
"""
author: 15025
time: 2020/12/30 20:27
software: PyCharm
"""
import numpy as np
class Debug:
@staticmethod
def mainProgram():
array = np.where([[True, False], [True, True]], [[1, 2], [3, 4]], [[9, 8], [7, 6]])
print("array的值為:")
print(array)
if __name__ == "__main__":
main = Debug()
main.mainProgram()
"""
array的值為:
[[1 8]
[3 4]]
"""
我們可以看到,這里的 [[True, False], [True, True]] 相當(dāng)于我們說的 condition,[[1, 2], [3, 4]] 相當(dāng)于 x,[[9, 8], [7, 6]] 相當(dāng)于 y,當(dāng)我們的 conditon 為 False 時(shí)從y中取出了數(shù)值 8,其他數(shù)值全部從 x 中的對(duì)應(yīng)位置取出。最終我們得到了上述結(jié)果。
示例5:更改二維數(shù)組中符合要求的數(shù)據(jù)
這里我們將二維數(shù)組中值大于等于 3 的元素更改為 8。
顯然,值大于等于 3 的元素對(duì)應(yīng)倒數(shù)第二個(gè)元素和最后一個(gè)元素。
import numpy as np
arr_2d = np.array([[1, 2],
[3, 4]])
pos_y, pos_x = np.where(arr_2d >= 3)
print(f"np.where() 函數(shù)得到的索引值元胞的形狀為: {arr_2d[np.where(arr_2d >= 3)].shape}")
print(f"np.where() 函數(shù)得到的索引值元胞的形狀為: {arr_2d[pos_y, pos_x].shape}")
print(f"二維數(shù)組 arr_2d 中滿足要求的元素為: {arr_2d[pos_y, pos_x]}")
arr_2d[pos_y, pos_x] = 8
print("修改元素后二維數(shù)組中存放的元素值為:")
print(arr_2d)
"""
result:
np.where() 函數(shù)得到的索引值元胞的形狀為: (2,)
np.where() 函數(shù)得到的索引值元胞的形狀為: (2,)
二維數(shù)組 arr_2d 中滿足要求的元素為: [3 4]
修改元素后二維數(shù)組中存放的元素值為:
[[1 2]
[8 8]]
"""
這里需要注意的一點(diǎn)是,當(dāng)我們使用 np.where() 函數(shù)獲取對(duì)應(yīng)二維數(shù)組中滿足要求的元素值的索引后,再通過 arr_2d[pos_y, pos_x] 獲取數(shù)組中滿足要求的元素時(shí),獲取到的滿足要求的元素會(huì)被自動(dòng)展平存放在一個(gè)一維數(shù)組中。
總結(jié)
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
一個(gè)簡單的python爬蟲程序 爬取豆瓣熱度Top100以內(nèi)的電影信息
這篇文章主要為大家詳細(xì)介紹了一個(gè)簡單的python爬蟲程序,爬取豆瓣熱度Top100以內(nèi)的電影信息,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-04-04
python中字符串?dāng)?shù)組逆序排列方法總結(jié)
在本篇文章里小編給大家整理了關(guān)于python中字符串?dāng)?shù)組如何逆序排列的相關(guān)知識(shí)點(diǎn),需要的朋友們學(xué)習(xí)下。2019-06-06
Python 如何手動(dòng)編寫一個(gè)自己的LRU緩存裝飾器的方法實(shí)現(xiàn)
本文主要介紹了Python如何手動(dòng)編寫一個(gè)自己的LRU緩存裝飾器,文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-12-12
Python網(wǎng)絡(luò)編程之Socket和HTTP協(xié)議詳解
在當(dāng)今互聯(lián)網(wǎng)時(shí)代,網(wǎng)絡(luò)編程是程序員不可或缺的一項(xiàng)技能,本文將介紹Python中兩種主要的網(wǎng)絡(luò)編程方式:Socket編程和基于HTTP協(xié)議的網(wǎng)絡(luò)編程,希望對(duì)大家有所幫助2024-04-04
Python實(shí)現(xiàn)對(duì)照片中的人臉進(jìn)行顏值預(yù)測(cè)
今天給大家?guī)淼氖顷P(guān)于Python實(shí)戰(zhàn)的相關(guān)知識(shí),文章圍繞如何用Python實(shí)現(xiàn)對(duì)照片中的人臉進(jìn)行顏值預(yù)測(cè)展開,文中有非常詳細(xì)的介紹及代碼示例,需要的朋友可以參考下2021-06-06
Django?celery的替代品Dramatiq使用特性詳解
這篇文章主要為大家介紹了Django?celery的替代品Dramatiq使用特性詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-06-06
Python創(chuàng)建對(duì)稱矩陣的方法示例【基于numpy模塊】
這篇文章主要介紹了Python創(chuàng)建對(duì)稱矩陣的方法,結(jié)合實(shí)例形式分析了Python基于numpy模塊實(shí)現(xiàn)矩陣運(yùn)算的相關(guān)操作技巧,需要的朋友可以參考下2017-10-10

