python中numpy 數(shù)組過濾詳解
在numpy
中,數(shù)組可以看作是一系列數(shù)值的有序集合,可以通過下標(biāo)訪問其中的元素。
處理數(shù)組的過程中,經(jīng)常需要用到數(shù)組過濾功能。
過濾功能可以在處理數(shù)據(jù)時(shí)非常有用,因?yàn)樗梢允箶?shù)據(jù)更加干凈和可讀性更強(qiáng)。
例如,在進(jìn)行數(shù)據(jù)分析時(shí),通常需要去除異常值,過濾掉不必要的元素可以使數(shù)據(jù)更加易于分析和處理。
numpy
本身提供了很多針對(duì)特定要求的過濾函數(shù),
不過本篇只介紹最基本的過濾方式,通過最基本的過濾方式來揭示其過濾的原理。
1. 比較
比較是過濾的前提,因?yàn)橥ㄟ^比較才能確定過濾的條件。
1.1. 數(shù)組和單個(gè)數(shù)字
import numpy as np arr = np.random.randint(0, 10, (3, 3)) print(arr) #運(yùn)行結(jié)果 [[4 1 4] [7 6 1] [8 9 5]] print(arr > 5) #運(yùn)行結(jié)果 [[False False False] [ True True False] [ True True False]]
數(shù)組和單個(gè)數(shù)字比較,也滿足上一篇介紹的廣播原則,也就是數(shù)組arr
的每個(gè)元素都和數(shù)字5
進(jìn)行了比較。
比較的結(jié)果是和arr
相同結(jié)構(gòu)的數(shù)組,數(shù)組中的元素是bool
值。
滿足比較條件是True
,不滿足比較條件的是False
。
1.2. 數(shù)組和數(shù)組
除了和單個(gè)數(shù)字比較之外,數(shù)組之間也是可以比較的。
arr1 = np.random.randint(0, 10, (3, 3)) print(arr1) #運(yùn)行結(jié)果 [[9 7 3] [2 8 5] [2 2 3]] arr2 = np.random.randint(0, 10, (3, 3)) print(arr2) #運(yùn)行結(jié)果 [[1 6 0] [0 1 8] [9 0 5]] print(arr1 > arr2) #運(yùn)行結(jié)果 [[ True True True] [ True True False] [False True False]]
數(shù)組之間的比較就是相同位置的元素之間比較,如果兩個(gè)數(shù)組的結(jié)構(gòu)不一樣,會(huì)按照上一篇介紹的廣播計(jì)算方式來擴(kuò)充數(shù)組。
比如:
arr1 = np.random.randint(0, 10, (3, 3)) print(arr1) #運(yùn)行結(jié)果 [[9 6 0] [1 4 9] [1 1 4]] arr2 = np.random.randint(0, 10, (3, 1)) print(arr2) #運(yùn)行結(jié)果 [[1] [0] [9]] print(arr1 > arr2) #運(yùn)行結(jié)果 [[ True True False] [ True True True] [False False False]]
上面的數(shù)組arr2,按廣播規(guī)則被擴(kuò)充成:
[[1 1 1]
[0 0 0]
[9 9 9]]
2. 掩碼
所謂掩碼,其實(shí)就是上面的各個(gè)示例中的比較結(jié)果。
也就是只包含bool值的數(shù)組,比如:
[[ True True False]
[ True True True]
[False False False]]
我們就是根據(jù)這個(gè)掩碼,來過濾出數(shù)組中的True
或者 False
位置的元素。
3. 過濾
過濾就是根據(jù)掩碼,選擇出符合條件的元素。
3.1. 單條件過濾
arr = np.random.randint(0, 10, (3, 3)) print(arr) #運(yùn)行結(jié)果 [[8 4 0] [2 2 9] [9 5 9]] print(arr[arr > 5]) #運(yùn)行結(jié)果 [8 9 9 9]
最后得到的是arr
中值大于5
的元素?cái)?shù)組。
其中 arr > 5
的結(jié)果就是上一節(jié)提到的掩碼,最后過濾出的元素就是根據(jù)這個(gè)掩碼得到的。
除了跟單獨(dú)的數(shù)字比較,也可以和數(shù)組比較:
arr1 = np.random.randint(0, 10, (3, 3)) print(arr1) #運(yùn)行結(jié)果 [[3 4 7] [4 6 2] [7 2 1]] arr2 = np.random.randint(0, 10, (3, 3)) print(arr2) #運(yùn)行結(jié)果 [[2 3 1] [7 7 7] [1 6 4]] print(arr1[arr1 > arr2]) #運(yùn)行結(jié)果 [3 4 7 7]
3.2. 多條件過濾
多條件過濾使用 &
和 |
來連接不同的條件。
arr1 = np.random.randint(0, 10, (3, 3)) print(arr1) #運(yùn)行結(jié)果 [[1 0 5] [7 4 9] [8 5 4]] arr2 = np.random.randint(0, 10, (3, 3)) print(arr2) #運(yùn)行結(jié)果 [[6 4 1] [0 1 1] [8 5 8]] print(arr1[(arr1 > 5) & (arr1 > arr2)]) #運(yùn)行結(jié)果 [7 9]
過濾arr1
中大于5
** 并且 **對(duì)應(yīng)位置比arr2
大的元素。
arr1 = np.random.randint(0, 10, (3, 3)) print(arr1) #運(yùn)行結(jié)果 [[1 0 5] [7 4 9] [8 5 4]] arr2 = np.random.randint(0, 10, (3, 3)) print(arr2) #運(yùn)行結(jié)果 [[6 4 1] [0 1 1] [8 5 8]] print(arr1[(arr1 > 5) | (arr1 > arr2)]) #運(yùn)行結(jié)果 [5 7 4 9 8]
過濾arr1
中大于5
** 或者 **對(duì)應(yīng)位置比arr2
大的元素。
4. 總結(jié)回顧
本篇主要介紹了過濾的基本原理,首先從比較開始,比較的結(jié)果是掩碼,最后通過掩碼過濾數(shù)組。
到此這篇關(guān)于python中numpy 數(shù)組過濾詳解的文章就介紹到這了,更多相關(guān)numpy 數(shù)組過濾內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- 在NumPy中創(chuàng)建空數(shù)組/矩陣的方法
- 詳解Numpy數(shù)組轉(zhuǎn)置的三種方法T、transpose、swapaxes
- numpy中的delete刪除數(shù)組整行和整列的實(shí)例
- 淺談numpy數(shù)組的幾種排序方式
- Python 取numpy數(shù)組的某幾行某幾列方法
- Python Numpy 數(shù)組的初始化和基本操作
- 詳解Numpy中的數(shù)組拼接、合并操作(concatenate, append, stack, hstack, vstack, r_, c_等)
- Numpy數(shù)組的保存與讀取方法
- python中找出numpy array數(shù)組的最值及其索引方法
- numpy中實(shí)現(xiàn)ndarray數(shù)組返回符合特定條件的索引方法
相關(guān)文章
淺析Python pandas模塊輸出每行中間省略號(hào)問題
這篇文章主要介紹Python pandas模塊輸出每行中間省略號(hào)問題,本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2018-07-07python中opencv支持向量機(jī)的實(shí)現(xiàn)
本文主要介紹了python中opencv支持向量機(jī)的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-03-03Python實(shí)現(xiàn)有趣的親戚關(guān)系計(jì)算器
每年的春節(jié),都會(huì)有一些自己幾乎沒印象但父母就是很熟的親戚,關(guān)系凌亂到你自己都說不清。本文就來用Python制作一個(gè)有趣的親戚關(guān)系計(jì)算器,感興趣的可以了解一下2023-01-01Django框架視圖函數(shù)設(shè)計(jì)示例
這篇文章主要介紹了Django框架視圖函數(shù)設(shè)計(jì),結(jié)合實(shí)例形式分析了Django框架視圖函數(shù)處理流程、原理與相關(guān)操作注意事項(xiàng),需要的朋友可以參考下2019-07-07Python實(shí)現(xiàn)從概率分布中隨機(jī)采樣
這篇文章主要介紹了通過幾個(gè)機(jī)器學(xué)習(xí)中最常用的概率分布為例,來看看如何從一個(gè)概率分布中采樣,文章中的代碼對(duì)我們的工作或?qū)W習(xí)具有一定價(jià)值,感興趣的朋友可以了解一下2021-12-12