seaborn繪制雙變量聯(lián)合分布圖示例詳解
繪制雙變量聯(lián)合分布圖
有時(shí)我們不僅需要查看單個(gè)變量的分 布,同時(shí)也需要查看變量之間的聯(lián)系, 往往還需要進(jìn)行預(yù)測等。這時(shí)就需要用到雙變量聯(lián)合分布了。
下面我們一起來看一下連續(xù)數(shù)值型數(shù)據(jù)雙變量之間的可視化方法。
在Seaborn中繪制連續(xù)數(shù)值型雙變量我們使用sns.jointplot():
說明文檔:https://seaborn.pydata.org/generated/seaborn.jointplot.html
seaborn.jointplot(x, y, data=None, kind='scatter')
- x、y:分別記錄x軸和y軸的數(shù)據(jù)名稱。
- data:數(shù)據(jù)集,data的數(shù)據(jù)類型為DataFrame。
- kind:用于設(shè)置圖像的類型,可選的類型有: 'scatter' | 'reg' | 'resid' | 'kde' | 'hex',分別表示散點(diǎn)圖、回歸圖、殘差圖、 核密度圖和蜂巢圖。
散點(diǎn)圖
如果我們希望看一看數(shù)據(jù)中兩個(gè)變量在二維平面上之間的關(guān)系時(shí), 則可以使用散點(diǎn)圖,因?yàn)樯Ⅻc(diǎn)圖可以幫助我們很容易地發(fā)現(xiàn)一些數(shù)據(jù)的分布規(guī)律。
import numpy as np
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt
df =pd.DataFrame({'x':np.random.normal(size=500),
'y':np.random.normal(size=500)})
sns.jointplot(x='x',y='y',data=df,kind='reg')
plt.show()
雙變量散點(diǎn)圖:

- 根據(jù)結(jié)果我們發(fā)現(xiàn), sns.jointplot()函數(shù)可以顯示兩個(gè)變量之間的聯(lián)合關(guān)系以及每個(gè)單變量的分布。
- 我們把函數(shù)中的 kind 參數(shù)設(shè)置為'reg' 就可以做一些簡單的線性模型擬合。
- 并且在坐標(biāo)系的上方和右側(cè)分別繪制了兩個(gè)變量的直方圖和核密度圖。
蜂巢圖
上面我們根據(jù)數(shù)據(jù)繪制了聯(lián)合散點(diǎn)圖,但是你會(huì)發(fā) 現(xiàn)兩個(gè)數(shù)據(jù)并沒有明確的線性關(guān)系,并且散點(diǎn)圖有 一個(gè)問題,就是相同的點(diǎn)會(huì)覆蓋在一起,導(dǎo)致我們 看不出來濃密和稀疏。 所以我們可以使用蜂巢圖查看一下數(shù)據(jù)的分布情況。
蜂巢圖的繪制還是使用seaborn.jointplot()函 數(shù),只是將kind參數(shù)更該為hex即可。
import numpy as np
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt
df =pd.DataFrame({'x':np.random.normal(size=500),
'y':np.random.normal(size=500)})
sns.jointplot(x='x',y='y',data=df,kind='hex')
plt.show()

蜂巢圖中每個(gè)六邊形表示一個(gè)范圍, 用顏色表示這個(gè)范圍內(nèi)的數(shù)據(jù)量,顏 色越白的地方數(shù)據(jù)量越小,顏色越深 的地方表示數(shù)據(jù)量越大。 當(dāng)數(shù)據(jù)比較大的時(shí)候該種方式,更容易找出數(shù)據(jù)的分布情況。
密度圖
在單變量分析的時(shí)候,我們繪制了單變量的概率密度曲線, 在雙變量中我們也可以使用密度圖來分析數(shù)據(jù)的分布情況。 密度圖的繪制還是使用seaborn.jointplot()函數(shù),只是將 kind參數(shù)更該為kde即可。
import numpy as np
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt
df =pd.DataFrame({'x':np.random.normal(size=500),
'y':np.random.normal(size=500)})
sns.jointplot(x='x',y='y',data=df,kind='kde')
plt.show()

根據(jù)圖形可以看出,雙變量密度圖是使用一些封閉 但是不規(guī)則的曲線來表示, 數(shù)據(jù)密度越高的地方顏色越深,數(shù)據(jù)密度越低的地方顏色越淺。
g = sns.jointplot(data=x_data, x=x, y=y) g.plot_joint(sns.kdeplot, color="r", zorder=0, levels=6) g.plot_marginals(sns.rugplot, color="r", height=-.15, clip_on=False)

sns.jointplot(
data=x_data, x=x, y=y,
marker="+", s=100, marginal_kws=dict(bins=25, fill=False),
)

以上就是seaborn繪制雙變量聯(lián)合分布圖示例詳解的詳細(xì)內(nèi)容,更多關(guān)于seaborn繪制雙變量聯(lián)合分布圖的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
tensorflow實(shí)現(xiàn)在函數(shù)中用tf.Print輸出中間值
今天小編就為大家分享一篇tensorflow實(shí)現(xiàn)在函數(shù)中用tf.Print輸出中間值,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-01-01
django rest framework serializer返回時(shí)間自動(dòng)格式化方法
這篇文章主要介紹了django rest framework serializer返回時(shí)間自動(dòng)格式化方法,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-03-03
Python數(shù)據(jù)擬合實(shí)現(xiàn)最小二乘法示例解析
這篇文章主要為大家介紹了Python數(shù)據(jù)擬合實(shí)現(xiàn)最小二乘法的示例解析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步2021-10-10
python反轉(zhuǎn)(逆序)字符串的6種方法詳細(xì)
這篇文章主要介紹了python反轉(zhuǎn)(逆序)字符串的6種方法詳細(xì),需要的朋友可以參考下2021-04-04
Python?Fire中兩種命令行參數(shù)靈活設(shè)置方式詳解
Python的Fire庫,一個(gè)用來生成命令行工具的的庫,這篇文章主要針對命令行參數(shù),補(bǔ)充兩種更加靈活的設(shè)置方式,感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2024-01-01
Python在畫圖時(shí)使用特殊符號的方法總結(jié)
在制作圖表時(shí),如果遇到需要利用特殊符號進(jìn)行表示時(shí)該怎么辦呢?不用慌,這篇文章為大家總結(jié)了python畫圖中使用各種特殊符號的方式,需要的可以參考一下2022-04-04
Python內(nèi)置方法實(shí)現(xiàn)字符串的秘鑰加解密(推薦)
在Python中實(shí)現(xiàn)AES算法需要借助的第三方庫Crypto,其在各個(gè)操作系統(tǒng)上的安裝方法有些許復(fù)雜,所以對于簡單的使用有點(diǎn)殺雞用牛刀的意思。這篇文章主要介紹了利用Python內(nèi)置方法實(shí)現(xiàn)字符串的秘鑰加解密,需要的朋友可以參考下2019-12-12

