欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python數(shù)據(jù)可視化Seaborn繪制山脊圖

 更新時(shí)間:2022年01月25日 14:35:02   作者:趙卓不凡?  
這篇文章主要介紹了利用python數(shù)據(jù)可視化Seaborn繪制山脊圖,山脊圖一般由垂直堆疊的折線圖組成,這些折線圖中的折線區(qū)域間彼此重疊,此外它們還共享相同的x軸.下面來(lái)看看具體的繪制過(guò)程吧,需要的小伙伴可以參考一下

1. 引言

山脊圖一般由垂直堆疊的折線圖組成,這些折線圖中的折線區(qū)域間彼此重疊,此外它們還共享相同的x軸.

山脊圖經(jīng)常以一種相對(duì)不常見且非常適合吸引大家注意力的緊湊圖的形式表現(xiàn)。觀察上圖,我們給其起名叫Ridge plot是非常恰當(dāng)?shù)?因?yàn)樯鲜鰣D表看起來(lái)確實(shí)很像山的脊背.此外,上述圖像還有另一個(gè)稱呼叫做Joy Plots–這主要是因?yàn)?code>Joy Division樂(lè)隊(duì)在如下專輯封面上采用了這種可視化形式.

2. 舉個(gè)栗子

在介紹完山脊圖的由來(lái)背景后,現(xiàn)在讓我們來(lái)舉個(gè)例子。我們使用以下數(shù)據(jù)集,主要包含 Netflix 的作品及對(duì)應(yīng)的 IMDB 分?jǐn)?shù)。

import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
df = pd.read_csv('./data/film.csv')
languages = ['English', 'Hindi', 'Spanish',?
? ? ? ? ? ? ?'French', 'Italian', 'Portuguese']
df_filtered = df[df['Language'].isin(languages)]
df_filtered

運(yùn)行結(jié)果如下:

上表中從左往右,依次為ID,電影名稱,電影類型,首映日期,電影長(zhǎng)度,IMDB評(píng)分,以及電影語(yǔ)種.

接下來(lái)我們首先使用 Seaborns FacetGrid庫(kù)來(lái)為每個(gè)語(yǔ)言類別的電影創(chuàng)建不同IMDB下的概率密度分布曲線圖。實(shí)現(xiàn)這個(gè)功能很簡(jiǎn)單,僅需要對(duì)數(shù)據(jù)表中相應(yīng)名稱字段來(lái)按值進(jìn)行分組統(tǒng)計(jì)即可。

代碼如下:

sns.set_theme(style="white")
g = sns.FacetGrid(df_filtered, row="Language")
g.map_dataframe(sns.kdeplot, x="IMDB Score")
g.set(ylabel="")

結(jié)果如下:

上述實(shí)現(xiàn)采用的為默認(rèn)的參數(shù)配置,橫軸表示IMDB分?jǐn)?shù),縱軸表示對(duì)應(yīng)不同語(yǔ)種電影在不同IMDB得分下的概率. 從上述圖例中可以看出單個(gè)語(yǔ)種電影評(píng)分的概率密度分布,但是很難查看不同語(yǔ)種間的對(duì)比分布。

接著我們嘗試來(lái)改進(jìn)顯示效果,我們通過(guò)設(shè)置FacetGrid函數(shù)中相應(yīng)的參數(shù)來(lái)讓圖表變得更寬更短。

代碼如下:

sns.set_theme(style="white")
g = sns.FacetGrid(df_filtered, row="Language", aspect=9, height=1.2)
g.map_dataframe(sns.kdeplot, x="IMDB Score")
g.set(ylabel="")

結(jié)果如下:

上述改進(jìn)雖然可以讓數(shù)據(jù)間的對(duì)比變得明顯一些,但是這個(gè)可視化從視覺(jué)效果上看并沒(méi)有太大的吸引力。

觀察上圖,我們其實(shí)并沒(méi)有多少人去關(guān)注左側(cè)的Y軸信息,我們更關(guān)注的是數(shù)據(jù)的形狀.這就意味著我們這里可以刪除Y軸.

代碼如下:

sns.set_theme(style="white")
g = sns.FacetGrid(df_filtered, row="Language", aspect=9, height=1.2)
g.map_dataframe(sns.kdeplot, x="IMDB Score")
g.set_titles("")
g.set(yticks=[],ylabel="")
g.despine(left=True)

運(yùn)行結(jié)果如下:

3.山脊圖

經(jīng)過(guò)我們的優(yōu)化,上述不同語(yǔ)種電影的IMDB得分概率密度分布還是不夠直觀.
接下來(lái)我們一步一步來(lái)介紹我們的終結(jié)法寶–山脊圖.

首先,我們需要確保背景是透明的。

sns.set_theme(style="white", rc={"axes.facecolor": (0, 0, 0, 0)})

接著,我們需要填充線條的內(nèi)部區(qū)域。

g.map_dataframe(sns.kdeplot, x="IMDB Score", fill=True, alpha=1)

上述操作后,不同語(yǔ)種間的區(qū)域會(huì)出現(xiàn)重疊,這時(shí)我們還需要區(qū)分重疊部分。

我們通過(guò)以下代碼進(jìn)行區(qū)分:

sns.set_theme(style="white", rc={"axes.facecolor": (0, 0, 0, 0)})
g = sns.FacetGrid(df_filtered, row="Language", aspect=9, height=1.2)
g.map_dataframe(sns.kdeplot, x="IMDB Score", fill=True, alpha=1)
g.map_dataframe(sns.kdeplot, x="IMDB Score", color='black')
g.fig.subplots_adjust(hspace=-.5)
g.set_titles("")
g.set(yticks=[])
g.despine(left=True)

運(yùn)行結(jié)果如下:

到目前位置,我們實(shí)現(xiàn)了我們第一版的山脊圖,接著我們可以根據(jù)需要來(lái)自定義擴(kuò)展它。
FacetGrid函數(shù)非常適合創(chuàng)建多個(gè)可視化圖例,并且 .map 和 .map_dataframe 方法可以讓我們與所有子圖進(jìn)行交互。

代碼如下:

sns.set_theme(style="white", rc={"axes.facecolor": (0, 0, 0, 0), 'axes.linewidth':2})
palette = sns.color_palette("Set2", 12)
g = sns.FacetGrid(df_filtered, palette=palette, row="Language", hue="Language", aspect=9, height=1.2)
g.map_dataframe(sns.kdeplot, x="IMDB Score", fill=True, alpha=1)
g.map_dataframe(sns.kdeplot, x="IMDB Score", color='black')
def label(x, color, label):
? ? ax = plt.gca()
? ? ax.text(0, .2, label, color='black', fontsize=13,
? ? ? ? ? ? ha="left", va="center", transform=ax.transAxes)
? ??
g.map(label, "Language")
g.fig.subplots_adjust(hspace=-.5)
g.set_titles("")
g.set(yticks=[], xlabel="IMDB Score")
g.despine( left=True)
plt.suptitle('Netflix Originals - IMDB Scores by Language', y=0.98)

運(yùn)行結(jié)果如下:

4.擴(kuò)展

最后,我們可以使用下面代碼來(lái)復(fù)制Joy Division 專輯封面的可視化效果。

代碼如下:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

if __name__ == "__main__":
? ? url = "./data/pulsar.csv"
? ? df = pd.read_csv(url, header=None)
? ? df = df.stack().reset_index()
? ? df.columns = ['idx', 'x', 'y']
? ? sns.set_theme(rc={"axes.facecolor": (0, 0, 0, 0), 'figure.facecolor':'#000000', 'axes.grid':False})
? ? g = sns.FacetGrid(df, row='idx', aspect=50, height=0.4)
? ? # Draw the densities in a few steps
? ? g.map(sns.lineplot, 'x', 'y', clip_on=False, alpha=1, linewidth=1.5)
? ? g.map(plt.fill_between, 'x', 'y', color='#000000')
? ? g.map(sns.lineplot, 'x', 'y', clip_on=False, color='#ffffff', lw=2)
? ? # Set the subplots to overlap
? ? g.fig.subplots_adjust(hspace=-0.95)
? ? g.set_titles("")
? ? g.set(yticks=[], xticks=[], ylabel="", xlabel="")
? ? g.despine(bottom=True, left=True)
? ? plt.savefig('joy.png', facecolor='#000000')

運(yùn)行結(jié)果如下:

5.結(jié)論

總的來(lái)說(shuō),山脊圖非常適合關(guān)注數(shù)據(jù)的分布對(duì)比。山脊圖以吸引人的美學(xué)可以引起觀眾的共鳴,使它們成為向用戶介紹數(shù)據(jù)分布對(duì)比分析時(shí)的絕佳選擇。

到此這篇關(guān)于python數(shù)據(jù)可視化Seaborn繪制山脊圖的文章就介紹到這了,更多相關(guān)Seaborn繪制山脊圖內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • pandas使用fillna函數(shù)填充NaN值的代碼實(shí)例

    pandas使用fillna函數(shù)填充NaN值的代碼實(shí)例

    最近在工作中遇到一個(gè)問(wèn)題,pandas讀取的數(shù)據(jù)中nan在保存后變成空字符串,所以下面這篇文章主要給大家介紹了關(guān)于pandas使用fillna函數(shù)填充NaN值的相關(guān)資料,文中通過(guò)實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下
    2022-07-07
  • Python進(jìn)階之利用+和*進(jìn)行列表拼接

    Python進(jìn)階之利用+和*進(jìn)行列表拼接

    在我們學(xué)習(xí)python的過(guò)程中,有一個(gè)非常常見的語(yǔ)法,那就是利用+和*進(jìn)行序列的拼接以及其他操作。今天就帶大家從使用+和*進(jìn)行拼接出發(fā)認(rèn)識(shí)一個(gè)大家非常容易犯的代碼錯(cuò)誤。話不多說(shuō)我們開始吧
    2023-04-04
  • pytorch常用函數(shù)定義及resnet模型修改實(shí)例

    pytorch常用函數(shù)定義及resnet模型修改實(shí)例

    這篇文章主要為大家介紹了pytorch常用函數(shù)定義及resnet模型修改實(shí)例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2022-06-06
  • Python Web開發(fā)模板引擎優(yōu)缺點(diǎn)總結(jié)

    Python Web開發(fā)模板引擎優(yōu)缺點(diǎn)總結(jié)

    這篇文章主要介紹了Python Web開發(fā)模板引擎優(yōu)缺點(diǎn)總結(jié),需要的朋友可以參考下
    2014-05-05
  • Django項(xiàng)目中使用JWT的實(shí)現(xiàn)代碼

    Django項(xiàng)目中使用JWT的實(shí)現(xiàn)代碼

    這篇文章主要介紹了Django項(xiàng)目中使用JWT的實(shí)現(xiàn)代碼,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-11-11
  • Python統(tǒng)計(jì)字符串中英文字母、空格、數(shù)字和其它字符的個(gè)數(shù)

    Python統(tǒng)計(jì)字符串中英文字母、空格、數(shù)字和其它字符的個(gè)數(shù)

    這篇文章主要給大家介紹了關(guān)于Python統(tǒng)計(jì)字符串中英文字母、空格、數(shù)字和其它字符的個(gè)數(shù)的相關(guān)資料,本文實(shí)例講述了python統(tǒng)計(jì)字符串中指定字符出現(xiàn)次數(shù)的方法,需要的朋友可以參考下
    2023-06-06
  • 詳解python數(shù)據(jù)結(jié)構(gòu)之隊(duì)列Queue

    詳解python數(shù)據(jù)結(jié)構(gòu)之隊(duì)列Queue

    這篇文章主要介紹了python數(shù)據(jù)結(jié)構(gòu)之隊(duì)列Queue,文中有非常詳細(xì)的代碼示例,對(duì)正在學(xué)習(xí)python的小伙伴們有很好的幫助,需要的朋友可以參考下
    2021-05-05
  • python pygame 憤怒的小鳥游戲示例代碼

    python pygame 憤怒的小鳥游戲示例代碼

    這篇文章主要介紹了python pygame 憤怒的小鳥游戲,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2021-02-02
  • python光學(xué)仿真實(shí)現(xiàn)光線追跡之空間關(guān)系

    python光學(xué)仿真實(shí)現(xiàn)光線追跡之空間關(guān)系

    這篇文章主要介紹了python光學(xué)仿真中實(shí)現(xiàn)光線追跡的空間關(guān)系示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步
    2021-10-10
  • 你所不知道的Python奇技淫巧13招【實(shí)用】

    你所不知道的Python奇技淫巧13招【實(shí)用】

    有時(shí)候你會(huì)看到很Cool的Python代碼,你驚訝于它的簡(jiǎn)潔,你不由自主地贊嘆:竟然還能這樣寫。其實(shí),這些優(yōu)雅的代碼都要?dú)w功于Python的特性,只要你能掌握這些Pythonic的技巧,你一樣可以寫出像詩(shī)一樣的Python代碼。本文主要介紹Python應(yīng)用的一些小技巧。一起來(lái)看下吧
    2016-12-12

最新評(píng)論