欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python通過四大 AutoEDA 工具包快速產(chǎn)出完美數(shù)據(jù)報告

 更新時間:2021年11月03日 16:25:53   作者:Python學(xué)習(xí)與數(shù)據(jù)挖掘  
在三年前,我們做數(shù)據(jù)競賽或者數(shù)據(jù)建模類的項目時,前期我們會耗費較多的時間去分析數(shù)據(jù),但現(xiàn)在非常多擅長數(shù)據(jù)分析的大師們已經(jīng)將我們平時??吹臄?shù)據(jù)方式進行了集成,開發(fā)了很多AutoEDA的工具包??梢詭椭覀児?jié)省大量時間

AutoEDA工具包對于剛剛學(xué)習(xí)數(shù)據(jù)分析的小伙伴可以帶來非常大的幫助。

本篇文章我們介紹目前最流行的四大AutoEDA工具包。

  • D-tale
  • Pandas-Profiling
  • Sweetviz
  • AutoViz

這幾個工具包可以以短短三五行代碼幫新手節(jié)省將近一天時間去寫代碼分析,非常建議大家收藏學(xué)習(xí),喜歡點贊支持,文末提供技術(shù)交流群,盡情暢聊。

介紹

01 D-Tale

圖片

D-Tale是Flask后端和React前端組合的產(chǎn)物,也是一個開源的Python自動可視化庫,可以為我們提供查看和分析Pandas DataFrame的方法,幫助我們獲得非常數(shù)據(jù)的詳細(xì)EDA。

目前D-Tale支持DataFrame、Series、MultiIndex、DatetimeIndex 和 RangeIndex 等 Pandas 對象。

Github 鏈接

https://github.com/man-group/dtale

# pip install dtale
import dtale
import pandas as pd
df = pd.read_csv('./data/titanic.csv')
d = dtale.show(df)
d.open_browser()

圖片

02 Pandas-Profiling

圖片

Pandas-Profiling可以對Pandas DataFrame生成report報告。其中:

  • pandas_profiling的df.profile_report()擴展了pandas DataFrame以方便進行快速數(shù)據(jù)分析。

Pandas-Profiling對于每一列特征,特征的統(tǒng)計信息(如果與列類型相關(guān))會顯示在交互式 HTML的report中:

  • Type:檢測數(shù)據(jù)列類型;
  • Essentials:類型、unique值、缺失值
  • 分位數(shù)統(tǒng)計,如最小值、Q1、中位數(shù)、Q3、最大值、范圍、四分位距
  • 描述性統(tǒng)計數(shù)據(jù),如均值、眾數(shù)、標(biāo)準(zhǔn)差、總和、中值絕對偏差、變異系數(shù)、峰態(tài)、偏度
  • 出現(xiàn)最多的值
  • 直方圖
  • 高度相關(guān)變量、Spearman、Pearson 和 Kendall 矩陣的相關(guān)性突出顯示
  • 缺失值矩陣、計數(shù)、熱圖和缺失值樹狀圖

Github 鏈接

https://github.com/pandas-profiling/pandas-profiling/

from pandas_profiling import ProfileReport
profile = ProfileReport(df, title="Pandas Profiling Report")
profile

2021-10-30 22:50:43,584 - INFO - Pandas backend loaded 1.2.5
2021-10-30 22:50:43,597 - INFO - Numpy backend loaded 1.19.2
2021-10-30 22:50:43,599 - INFO - Pyspark backend NOT loaded
2021-10-30 22:50:43,600 - INFO - Python backend loaded

一個特征的案例

圖片

03 Sweetviz

圖片

Sweetviz也是一個開源Python庫,Sweetviz可以用簡短幾行代碼生成美觀、高密度的可視化文件,只需兩行代碼即可開啟探索性數(shù)據(jù)分析并輸出一個完全獨立的 HTML 應(yīng)用程序。Sweetviz主要包含下面的分析:

  • 數(shù)據(jù)集概述
  • 變量屬性
  • 類別的關(guān)聯(lián)性
  • 數(shù)值關(guān)聯(lián)性
  • 數(shù)值特征最頻繁值、最小、最大值

Github 鏈接

https://github.com/fbdesignpro/sweetviz

# pip install sweetviz
import sweetviz as sv 
sweetviz_report = sv.analyze(df)
sweetviz_report.show_html() 

04 AutoViz

圖片

AutoViz可以使用一行自動顯示任何數(shù)據(jù)集。給出任何輸入文件(CSV、txt或json),AutoViz都可以對其進行可視化。AutoViz的結(jié)果會以非常多的圖片都形式存在文件夾下方。

Github 鏈接

https://github.com/AutoViML/AutoViz

# pip install autoviz
from autoviz.AutoViz_Class import AutoViz_Class
AV = AutoViz_Class()

sep = ';'
dft = AV.AutoViz(filename="",sep=sep, depVar='Pclass', dfte=df, header=0, verbose=2, 
                 lowess=False, chart_format='png', max_rows_analyzed=150000, max_cols_analyzed=30)

諸多文件全都在當(dāng)前文件夾下方

圖片

我們打開其中一個效果如下:

圖片

適用問題

適用于所有的數(shù)據(jù)分析問題。

技術(shù)交流

歡迎轉(zhuǎn)載、收藏、有所收獲點贊支持一下!

在這里插入圖片描述

到此這篇關(guān)于Python通過四大 AutoEDA 工具包快速產(chǎn)出完美數(shù)據(jù)報告的文章就介紹到這了,更多相關(guān)Python AutoEDA工具包內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • python正則表達式實現(xiàn)自動化編程

    python正則表達式實現(xiàn)自動化編程

    這篇文章主要介紹了python正則表達式實現(xiàn)自動化編程,re模塊的compile()方法是構(gòu)成正則表達式的方法,向compile()傳入一個字符串表示正則表達式,該方法返回一個Regex模式的對象,需要的朋友可以參考下
    2023-01-01
  • Python爬蟲新手入門之初學(xué)lxml庫

    Python爬蟲新手入門之初學(xué)lxml庫

    這篇文章主要給大家介紹了關(guān)于Python爬蟲新手入門之初學(xué)lxml庫的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-12-12
  • 關(guān)于PyTorch環(huán)境配置及安裝教程(Windows10)

    關(guān)于PyTorch環(huán)境配置及安裝教程(Windows10)

    這篇文章主要介紹了關(guān)于PyTorch環(huán)境配置及安裝教程(Windows10),具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-07-07
  • 詳解Tensorflow數(shù)據(jù)讀取有三種方式(next_batch)

    詳解Tensorflow數(shù)據(jù)讀取有三種方式(next_batch)

    本篇文章主要介紹了Tensorflow數(shù)據(jù)讀取有三種方式(next_batch),小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-02-02
  • Python Tkinter模塊 GUI 可視化實例

    Python Tkinter模塊 GUI 可視化實例

    今天小編就為大家分享一篇Python Tkinter模塊 GUI 可視化實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-11-11
  • 對python pandas中 inplace 參數(shù)的理解

    對python pandas中 inplace 參數(shù)的理解

    這篇文章主要介紹了對python pandas中 inplace 參數(shù)的理解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-06-06
  • Python和Go語言的區(qū)別總結(jié)

    Python和Go語言的區(qū)別總結(jié)

    在本篇文章里小編給大家分享了關(guān)于Python和Go語言的區(qū)別相關(guān)知識點,需要的朋友們學(xué)習(xí)下。
    2019-02-02
  • python實現(xiàn)局部圖像放大

    python實現(xiàn)局部圖像放大

    這篇文章主要介紹了python實現(xiàn)局部圖像放大,畫中畫形式展示,文中示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2021-11-11
  • python 集合常用操作匯總

    python 集合常用操作匯總

    這篇文章主要介紹了python 集合常用操作匯總的相關(guān)資料,需要的朋友可以參考下
    2022-12-12
  • python 實現(xiàn)socket服務(wù)端并發(fā)的四種方式

    python 實現(xiàn)socket服務(wù)端并發(fā)的四種方式

    這篇文章主要介紹了python 實現(xiàn)socket服務(wù)端并發(fā)的四種方式,幫助大家更好的理解和使用python,感興趣的朋友可以了解下
    2020-12-12

最新評論