Python數(shù)據(jù)清洗工具之Numpy的基本操作
1. Numpy(Numberical Python)
Anaconda中已經集成了NumPy,可以直接使用。如果想要自行安裝的話,可以使用流行的Python
包安裝程序 pip 來安裝 NumPy,目前使用的是Anaconde的環(huán)境進行學習和使用這個庫
1.1 這庫的安裝方法
CMD :pip install numpy
或者使用清華源的鏡像庫:pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple
(直接復制可用)
如果想查看這個庫的版本:
import numpy as np np.__version__
其實很多其他庫也可以用這個方法進行查看庫的版本
2.Numpy的基礎操作
Numpy的操作對象是一個ndarray,所以在使用這個庫進行計算的時候需要將數(shù)據(jù)進行轉化
2.1 數(shù)組的創(chuàng)建:np.arrary()
np.array 可以把 list,tuple或者其他的序列模式的數(shù)據(jù)轉創(chuàng)建為 ndarray,默認創(chuàng)建一個新的
ndarray
我們會發(fā)現(xiàn)原來數(shù)據(jù)里面有int, float型的數(shù)據(jù)都被轉換成相同的類型了,統(tǒng)一轉變成float型的數(shù)據(jù)了,因為Numpy是要求array里面的數(shù)據(jù)類型是一致的
2.2 N維數(shù)組的創(chuàng)建
Numpy不僅可以生成一維數(shù)組,也可以生成多維數(shù)組。
比如,可以生成如下的二維數(shù)組:
2.3 常用數(shù)組
2.4 線性數(shù)組的生成
2.5 數(shù)組的運算
數(shù)組的運算時對應位置的元素進行簡單的四則運算
這里需要注意的是,數(shù)組x和數(shù)組y的元素個數(shù)是相同的(兩者均是元素個數(shù)為3的一維數(shù)組)
當兩者元素個數(shù)相同時,可以對各個元素進行算術運算。如果元素個數(shù)不同,則會報錯,所以保
持元素個數(shù)一致非常重要。
此外,Numpy數(shù)組不僅可以進行對應元素的算術運算,還可以和單一的數(shù)值(標量)組合起來進
行運算(這個功能也被稱為廣播,后面會詳細介紹),比如:
會把數(shù)據(jù)轉成數(shù)組默認的float的數(shù)據(jù)類型
2.6 數(shù)組的形狀變換
我們先定義一個數(shù)組
如果數(shù)組的量級比較大,對于計算的時候只知道其他的一個維度數(shù)字,則可以使用下面的-1,作為占位符,會自動幫你補齊另外一個維度的信息
除此之外,還有一種比較常用的數(shù)組拉平方法, m.flatten()以及m.ravel(),這兩種方法類似
3. 數(shù)組的索引
可以將這個二維的數(shù)組看成一個矩陣,3行四列, 通過數(shù)字的下標索引進行提取數(shù)字,這里的切片操作還是左閉右開的
4.廣播功能
術語廣播是指 NumPy 在算術運算期間處理不同形狀的數(shù)組的能力。
廣播可以簡單理解為用于不同大小數(shù)組的計算(加、減、乘、除等)的一組規(guī)則。
如果數(shù)組的形狀相同,則對相應元素逐個計算,但是如果數(shù)組的維度不相同,就需要用到廣播機制
Numpy的廣播遵循一組嚴格的規(guī)則:
規(guī)則1:如果兩個數(shù)組的維度數(shù)不相同,那么小維度數(shù)組的形狀將會在最左邊補1規(guī)則2:如果兩個數(shù)組的形狀在任何一個維度上都不匹配,那么數(shù)組的形狀會沿著維度為1的維度擴展以匹配另外一個數(shù)組的形狀規(guī)則3:如果兩個數(shù)組的形狀在任何一個維度上都不匹配并且沒有任何一個維度為1,則會引 發(fā)異常無法廣播
到此這篇關于Python數(shù)據(jù)清洗工具之Numpy的基本操作的文章就介紹到這了,更多相關Python數(shù)據(jù)清洗內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
python 在threading中如何處理主進程和子線程的關系
這篇文章主要介紹了python 在threading中如何處理主進程和子線程的關系,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-04-04