欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python之np.where()如何替換缺失值

 更新時間:2024年02月02日 15:45:32   作者:Asher117  
這篇文章主要介紹了Python中的np.where()如何替換缺失值問題,具有很好的參考價(jià)值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教

np.where()替換缺失值

使用Python做數(shù)據(jù)分析時經(jīng)常需要替換缺失值。

np.where(條件,x,y)

np.where函數(shù)的結(jié)果是,如果“條件”為真,則x,否則y。

如下:

import pandas as pd
import numpy as np
df = pd.DataFrame(data={
    'A':[1,1,np.nan,2],
    'B':[2,np.nan,4,5],
    'C':[3,8,12,6]
})
df
     A    B    C
0    1.0    2.0    3
1    1.0    NaN    8
2    NaN    4.0    12
3    2.0    5.0    6

使用np.where在A列缺失值處填C列的數(shù)

df['A'] = np.where(df['A'].isnull(),df['C'],df['A'])
df
    A    B    C
0    1.0    2.0    3
1    1.0    NaN    8
2    12.0 4.012
3    2.0    5.0    6
####################

使用data(DataFrame)的A列,填補(bǔ)df的A列

eg:

df['A'] = np.where(df['A'].isnull(),data['A'],df['A'])

np.where()函數(shù)

調(diào)用方式及參數(shù)說明

numpy.where(condition[, x, y])

各個參數(shù)意義:

  • condition:類似數(shù)組的對象,布爾值
  • x, y:類似數(shù)組的對象,給出值的地方,如果 conditionTrue,從 x 中選取值,conditionFalse,從 y 中選取值。

有返回值,返回一個滿足條件時取x中對應(yīng)的值,不滿足條件時取 y 中對應(yīng)值的數(shù)組。

注意:

這里的 conditionx,y只是為了表示以及說明時的必要,并不是真正意義上的關(guān)鍵字。

示例1:獲取一維數(shù)組中最大元素所處位置

這里我們給出使用 np.where() 函數(shù)獲取一維數(shù)組中最大值對應(yīng)位置的例子。

# -*- coding:utf-8 -*-
"""
author: 15025
time: 2020/12/30 20:27
software: PyCharm
"""
import numpy as np


class Debug:
    @staticmethod
    def mainProgram():
        array = np.array([0, 1, 2, 3, 5, 4])
        array_ = np.where(array == np.max(array))
        print("array_的值為:")
        print(array_)


if __name__ == "__main__":
    main = Debug()
    main.mainProgram()
"""
array_的值為:
(array([4], dtype=int64),)
"""

這里 array_ 的結(jié)果為 44 表示一維數(shù)組中最大元素所對應(yīng)的索引值。

示例2:獲取二維數(shù)組中最大元素所處位置

# -*- coding:utf-8 -*-
"""
author: 15025
time: 2020/12/30 20:27
software: PyCharm
"""
import numpy as np


class Debug:
    @staticmethod
    def mainProgram():
        array = np.array([[0, 1, 2, 3, 5, 4, 5], [0, 1, 2, 3, 4, 5, 5]])
        array_ = np.where(array == np.max(array))
        print("array_的值為:")
        print(array_)


if __name__ == "__main__":
    main = Debug()
    main.mainProgram()
"""
array_的值為:
(array([0, 0, 1, 1], dtype=int64), array([4, 6, 5, 6], dtype=int64))
"""

首先通過觀察不難發(fā)現(xiàn),該二維數(shù)組中的最大值為 5,且一共有 4 個最大元素存在,因此,最終的結(jié)果應(yīng)該存在 4 組數(shù)據(jù)表示這四個元素的位置。

結(jié)果中的 array([0, 0, 1, 1], dtype=int64) 表示數(shù)組中的 y 索引值,array([4, 6, 5, 6], dtype=int64) 表示 x 的索引值。

示例3:獲取三維數(shù)組中最大元素所處位置

# -*- coding:utf-8 -*-
"""
author: 15025
time: 2020/12/30 20:27
software: PyCharm
"""
import numpy as np


class Debug:
    @staticmethod
    def mainProgram():
        array = np.array([[[0, 1], [0, 1]],
                          [[1, 2], [1, 2]],
                          [[1, 3], [1, 3]]])
        array_ = np.where(array == np.max(array))
        print("array_的值為:")
        print(array_)


if __name__ == "__main__":
    main = Debug()
    main.mainProgram()
"""
array_的值為:
(array([2, 2], dtype=int64), array([0, 1], dtype=int64), array([1, 1], dtype=int64))
"""

顯而易見,三維結(jié)果同二維的情況類似,只是多了一個維度,且輸出結(jié)果三組數(shù)據(jù)分別對應(yīng) z,y,x 坐標(biāo),其他的這里不做過多解釋了。

示例4:Condition 方法

# -*- coding:utf-8 -*-
"""
author: 15025
time: 2020/12/30 20:27
software: PyCharm
"""
import numpy as np


class Debug:
    @staticmethod
    def mainProgram():
        array = np.where([[True, False], [True, True]], [[1, 2], [3, 4]], [[9, 8], [7, 6]])
        print("array的值為:")
        print(array)


if __name__ == "__main__":
    main = Debug()
    main.mainProgram()
"""
array的值為:
[[1 8]
 [3 4]]
"""

我們可以看到,這里的 [[True, False], [True, True]] 相當(dāng)于我們說的 condition,[[1, 2], [3, 4]] 相當(dāng)于 x[[9, 8], [7, 6]] 相當(dāng)于 y,當(dāng)我們的 conditonFalse 時從y中取出了數(shù)值 8,其他數(shù)值全部從 x 中的對應(yīng)位置取出。最終我們得到了上述結(jié)果。

示例5:更改二維數(shù)組中符合要求的數(shù)據(jù)

這里我們將二維數(shù)組中值大于等于 3 的元素更改為 8。

顯然,值大于等于 3 的元素對應(yīng)倒數(shù)第二個元素和最后一個元素。

import numpy as np

arr_2d = np.array([[1, 2],
              [3, 4]])

pos_y, pos_x = np.where(arr_2d >= 3)

print(f"np.where() 函數(shù)得到的索引值元胞的形狀為: {arr_2d[np.where(arr_2d >= 3)].shape}") 
print(f"np.where() 函數(shù)得到的索引值元胞的形狀為: {arr_2d[pos_y, pos_x].shape}")
print(f"二維數(shù)組 arr_2d 中滿足要求的元素為: {arr_2d[pos_y, pos_x]}")

arr_2d[pos_y, pos_x] = 8
print("修改元素后二維數(shù)組中存放的元素值為:")
print(arr_2d)
"""
result:
np.where() 函數(shù)得到的索引值元胞的形狀為: (2,)
np.where() 函數(shù)得到的索引值元胞的形狀為: (2,)
二維數(shù)組 arr_2d 中滿足要求的元素為: [3 4]
修改元素后二維數(shù)組中存放的元素值為:
[[1 2]
 [8 8]]
"""

這里需要注意的一點(diǎn)是,當(dāng)我們使用 np.where() 函數(shù)獲取對應(yīng)二維數(shù)組中滿足要求的元素值的索引后,再通過 arr_2d[pos_y, pos_x] 獲取數(shù)組中滿足要求的元素時,獲取到的滿足要求的元素會被自動展平存放在一個一維數(shù)組中。

總結(jié)

以上為個人經(jīng)驗(yàn),希望能給大家一個參考,也希望大家多多支持腳本之家。

相關(guān)文章

最新評論