欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Pandas庫(kù)中dataframe.corr()函數(shù)的使用

 更新時(shí)間:2024年07月22日 11:35:59   作者:Midsummer-逐夢(mèng)  
dataframe.corr()是Pandas庫(kù)中的一個(gè)函數(shù),用于計(jì)算DataFrame中各列之間的相關(guān)系數(shù),本文主要介紹了Pandas庫(kù)中dataframe.corr()函數(shù)的使用,具有一定的參考價(jià)值,感興趣的可以了解一下

一、簡(jiǎn)介

dataframe.corr()是Pandas庫(kù)中的一個(gè)函數(shù),用于計(jì)算DataFrame中各列之間的相關(guān)系數(shù)。相關(guān)系數(shù)衡量的是兩個(gè)變量之間線(xiàn)性關(guān)系的強(qiáng)度和方向,結(jié)果在-1到1之間,分別表示完全負(fù)相關(guān)和完全正相關(guān)。

二、語(yǔ)法和參數(shù)

DataFrame.corr(method='pearson', min_periods=1)

method: 可選。計(jì)算相關(guān)系數(shù)的方法,有’pearson’(默認(rèn))、‘kendall’、'spearman’三種可選。

  • 'pearson':標(biāo)準(zhǔn)皮爾遜相關(guān)系數(shù)。
  • 'kendall':肯德?tīng)柕燃?jí)相關(guān)系數(shù)。
  • 'spearman':斯皮爾曼等級(jí)相關(guān)系數(shù)。

min_periods: 可選。每對(duì)元素的最小數(shù)量,以便計(jì)算相關(guān)系數(shù)。

三、實(shí)例

3.1 計(jì)算默認(rèn)的皮爾遜相關(guān)系數(shù)

import pandas as pd

# 創(chuàng)建示例數(shù)據(jù)
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [5, 4, 3, 2, 1],
    'C': [2, 2, 3, 4, 4]
}
df = pd.DataFrame(data)

# 計(jì)算相關(guān)系數(shù)
correlation_matrix = df.corr()
print(correlation_matrix)

輸出:

          A         B         C
A  1.000000 -1.000000  0.948683
B -1.000000  1.000000 -0.948683
C  0.948683 -0.948683  1.000000

3.2 計(jì)算斯皮爾曼相關(guān)系數(shù)

import pandas as pd

# 創(chuàng)建示例數(shù)據(jù)
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [5, 4, 3, 2, 1],
    'C': [2, 2, 3, 4, 4]
}
df = pd.DataFrame(data)

# 計(jì)算相關(guān)系數(shù)
correlation_matrix = df.corr(method='spearman')
print(correlation_matrix)

輸出:

          A         B         C
A  1.000000 -1.000000  0.948683
B -1.000000  1.000000 -0.948683
C  0.948683 -0.948683  1.000000

3.3 計(jì)算斯皮爾曼相關(guān)系數(shù)

import pandas as pd

# 創(chuàng)建示例數(shù)據(jù)
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [5, 4, 3, 2, 1],
    'C': [2, 2, 3, 4, 4]
}
df = pd.DataFrame(data)

# 計(jì)算相關(guān)系數(shù)
correlation_matrix = df.corr(method='kendall')
print(correlation_matrix)

輸出

          A         B         C
A  1.000000 -1.000000  0.894427
B -1.000000  1.000000 -0.894427
C  0.894427 -0.894427  1.000000

四、注意事項(xiàng)

  • 當(dāng)使用kendallspearman方法時(shí),計(jì)算可能會(huì)比pearson方法慢,因?yàn)檫@些方法需要排序。
  • 如果數(shù)據(jù)集中存在NaN值,默認(rèn)情況下這些值會(huì)被忽略。
  • 計(jì)算相關(guān)系數(shù)前,確保數(shù)據(jù)已經(jīng)清洗并準(zhǔn)備好,以避免錯(cuò)誤或不準(zhǔn)確的結(jié)果。

到此這篇關(guān)于Pandas庫(kù)中dataframe.corr()函數(shù)的使用的文章就介紹到這了,更多相關(guān)Pandas dataframe.corr()函數(shù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家! 

相關(guān)文章

最新評(píng)論