Pandas庫中dataframe.corr()函數(shù)的使用
一、簡介
dataframe.corr()
是Pandas庫中的一個函數(shù),用于計算DataFrame中各列之間的相關系數(shù)。相關系數(shù)衡量的是兩個變量之間線性關系的強度和方向,結果在-1到1之間,分別表示完全負相關和完全正相關。
二、語法和參數(shù)
DataFrame.corr(method='pearson', min_periods=1)
method: 可選。計算相關系數(shù)的方法,有’pearson’(默認)、‘kendall’、'spearman’三種可選。
'pearson'
:標準皮爾遜相關系數(shù)。'kendall'
:肯德爾等級相關系數(shù)。'spearman'
:斯皮爾曼等級相關系數(shù)。
min_periods: 可選。每對元素的最小數(shù)量,以便計算相關系數(shù)。
三、實例
3.1 計算默認的皮爾遜相關系數(shù)
import pandas as pd # 創(chuàng)建示例數(shù)據(jù) data = { 'A': [1, 2, 3, 4, 5], 'B': [5, 4, 3, 2, 1], 'C': [2, 2, 3, 4, 4] } df = pd.DataFrame(data) # 計算相關系數(shù) correlation_matrix = df.corr() print(correlation_matrix)
輸出:
A B C
A 1.000000 -1.000000 0.948683
B -1.000000 1.000000 -0.948683
C 0.948683 -0.948683 1.000000
3.2 計算斯皮爾曼相關系數(shù)
import pandas as pd # 創(chuàng)建示例數(shù)據(jù) data = { 'A': [1, 2, 3, 4, 5], 'B': [5, 4, 3, 2, 1], 'C': [2, 2, 3, 4, 4] } df = pd.DataFrame(data) # 計算相關系數(shù) correlation_matrix = df.corr(method='spearman') print(correlation_matrix)
輸出:
A B C
A 1.000000 -1.000000 0.948683
B -1.000000 1.000000 -0.948683
C 0.948683 -0.948683 1.000000
3.3 計算斯皮爾曼相關系數(shù)
import pandas as pd # 創(chuàng)建示例數(shù)據(jù) data = { 'A': [1, 2, 3, 4, 5], 'B': [5, 4, 3, 2, 1], 'C': [2, 2, 3, 4, 4] } df = pd.DataFrame(data) # 計算相關系數(shù) correlation_matrix = df.corr(method='kendall') print(correlation_matrix)
輸出
A B C
A 1.000000 -1.000000 0.894427
B -1.000000 1.000000 -0.894427
C 0.894427 -0.894427 1.000000
四、注意事項
- 當使用
kendall
和spearman
方法時,計算可能會比pearson
方法慢,因為這些方法需要排序。 - 如果數(shù)據(jù)集中存在
NaN
值,默認情況下這些值會被忽略。 - 計算相關系數(shù)前,確保數(shù)據(jù)已經(jīng)清洗并準備好,以避免錯誤或不準確的結果。
到此這篇關于Pandas庫中dataframe.corr()函數(shù)的使用的文章就介紹到這了,更多相關Pandas dataframe.corr()函數(shù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
- 探討python??pandas.DataFrame.to_json?函數(shù)
- pandas DataFrame.to_sql()用法小結
- 使用pandas中的DataFrame.rolling方法查看時間序列中的異常值
- Python Pandas Dataframe.describe()使用及代碼實例
- 解讀pandas.DataFrame.corrwith
- Python?Pandas中DataFrame.drop_duplicates()刪除重復值詳解
- pandas.DataFrame.iloc的具體使用詳解
- pandas.DataFrame.from_dict直接從字典構建DataFrame的方法
- pandas.DataFrame.drop_duplicates 用法介紹
相關文章
python標準算法實現(xiàn)數(shù)組全排列的方法
這篇文章主要介紹了python標準算法實現(xiàn)數(shù)組全排列的方法,實例分析了全排列的原理與Python實現(xiàn)技巧,需要的朋友可以參考下2015-03-03Python實現(xiàn)base64編碼的圖片保存到本地功能示例
這篇文章主要介紹了Python實現(xiàn)base64編碼的圖片保存到本地功能,涉及Python針對base64編碼解碼與圖形文件輸出保存相關操作技巧,需要的朋友可以參考下2018-06-06使用Python獲取CPU、內(nèi)存和硬盤等windowns系統(tǒng)信息的2個例子
這篇文章主要介紹了使用Python獲取CPU、內(nèi)存和硬盤等windowns系統(tǒng)信息的2個例子,使用的python wmi模塊,需要的朋友可以參考下2014-04-04Python中條件語句、循環(huán)語句和pass語句的使用示例
Python條件語句是通過一條或多條語句的執(zhí)行結果(True或者False)來決定執(zhí)行的代碼塊,下面這篇文章主要給大家介紹了關于Python中條件語句、循環(huán)語句和pass語句使用的相關資料,需要的朋友可以參考下2022-06-06Python實現(xiàn)對數(shù)坐標系繪制與自定義映射
這篇文章主要為大家學習介紹了如何利用Python實現(xiàn)對數(shù)坐標系繪制與坐標自定義映射,文中的示例代碼講解詳細,感興趣的小伙伴可以了解一下2023-08-08