Pearson相關系數(shù)和Spearman相關系數(shù)的區(qū)別及說明
前言
相關系數(shù)是用以反映變量之間的相關關系程度的統(tǒng)計指標。
其取值范圍是[-1,1],當取值為0時表示不相關,取值為[-1,0)表示負相關,取值為(0,-1],表示負相關。
目前常用的兩種相關性系數(shù)為皮爾森相關系數(shù)(Pearson)和斯皮爾曼等級相關系數(shù)(Spearman)
簡介
1.皮爾森相關系數(shù)評估兩個連續(xù)變量之間的線性關系。

其中:

-1 ≤ p ≤ 1
p接近0代表無相關性
p接近1或-1代表強相關性
2.斯皮爾曼相關系數(shù)評估兩個連續(xù)變量之間的單調關系。在單調關系中,變量趨于一起變化,但不一定以恒定速率變化。

其中:

N是觀測值的總數(shù)量
斯皮爾曼另一種表達公式:


表示二列成對變量的等級差數(shù)。
區(qū)別
Pearson和Spearman相關系數(shù)的范圍可以從-1到+1。
當Pearson相關系數(shù)為+1時,意味著,當一個變量增加時,另一個變量增加一致量。
這形成了一種遞增的直線。
在這種情況下,Spearman相關系數(shù)也是+1。

如果關系是一個變量在另一個變量增加時增加,但數(shù)量不一致,則Pearson相關系數(shù)為正但小于+1。
在這種情況下,斯皮爾曼系數(shù)仍然等于+1。

當關系是隨機的或不存在時,則兩個相關系數(shù)幾乎為零。

如果關系遞減的直線,那么兩個相關系數(shù)都是-1。

如果關系是一個變量在另一個變量增加時減少,但數(shù)量不一致,則Pearson相關系數(shù)為負但大于-1。
在這種情況下,斯皮爾曼系數(shù)仍然等于-1

相關值-1或1意味著精確的線性關系,如圓的半徑和圓周之間的關系。
然而,相關值的實際價值在于量化不完美的關系。
發(fā)現(xiàn)兩個變量是相關的經(jīng)常通知回歸分析,該分析試圖更多地描述這種類型的關系。
其他非線性關系
Pearson相關系數(shù)僅評估線性關系。Spearman相關系數(shù)僅評估單調關系。
因此,即使相關系數(shù)為0,也可以存在有意義的關系。
檢查散點圖以確定關系的形式。

該圖顯示了非常強的關系。
Pearson系數(shù)和Spearman系數(shù)均約為0。
結論
皮爾森評估的是兩個變量的線性關系,而斯皮爾曼評估的兩變量的單調關系。
因此,斯皮爾曼相關系數(shù)對于數(shù)據(jù)錯誤和極端值的反應不敏感。
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
Python?數(shù)據(jù)分析教程探索性數(shù)據(jù)分析
這篇文章主要介紹了Python?數(shù)據(jù)分析教程探索性數(shù)據(jù)分析,文章圍繞主題展開詳細的內容介紹,具有一定的參考價值,需要的小伙伴可以參考一下2022-08-08
TensorFlow實現(xiàn)AutoEncoder自編碼器
這篇文章主要為大家詳細介紹了TensorFlow實現(xiàn)AutoEncoder自編碼器,具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-03-03
Django實現(xiàn)靜態(tài)文件緩存到云服務的操作方法
這篇文章主要介紹了Django實現(xiàn)靜態(tài)文件緩存到云服務的操作方法,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-08-08

