Python數據分析之?Pandas?Dataframe應用自定義
前言:
在進行數據分析時,難免需要對數據集應用一些我們自定義的一些函數,或者其他庫的函數,得到我們想要的數據,這種情況下,可能大家第一時間想到的是使用for循環(huán)遍歷Dataframe對象,取到指定行/列的數據再進行自定義函數的應用,當然這種方法完全可以實現,但是效率不高,接下來就來介紹一下在Pandas中如何對數據集高效的進行自定義函數的應用。
應用函數
apply 方法
apply()
函數是一個自定義函數作用于某一行或幾行,或者某一列或多列上的每一個元素, 使用格式如下:
df.apply(func, axis=0, *args, **kwargs)
參數如下:
- func:指定函數
- axis:指定作用于行還是列,默認為0,表示作用于列,設置為1表示作用于行
- *args&**kwargs:接收任意數量、類型的參數,這些參數被傳遞到函數func
例如,對下面Dataframe執(zhí)行進行操作:
自定義"返回最大值"的函數并作用于該Dataframe:
def func(x): return x.max() df.apply(func)
結果輸出如下:
可見,結果返回了每列最大的值,如果想返回每行最大的值,設置axis=1
即可。
當然apply()
也支持傳遞lambda匿名函數。
applymap 方法
applymap()
函數可以作用于DataFrame中的每一個元素,例如,轉換DataFrame中數據的格式:
df.applymap(lambda x: '%.2f' % x)
注意:Pandas還提供了一個map()
方法,作用于Series對象,此類方法和Python原生的map()
方法都很類似。
到此這篇關于Python數據分析之 Pandas Dataframe應用自定義的文章就介紹到這了,更多相關Pandas Dataframe應用自定義內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
使用pyinstaller打包PyQt4程序遇到的問題及解決方法
今天小編就為大家分享一篇使用pyinstaller打包PyQt4程序遇到的問題及解決方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-06-06