python?Sweetviz探索性數(shù)據(jù)可視化分析庫使用特征詳解
python Sweetviz庫
今天給大家分享一個神奇的 python 庫,Sweetviz。
https://github.com/fbdesignpro/sweetviz
探索性數(shù)據(jù)分析是一個我們傾向于使用可視化方法來分析數(shù)據(jù)集并總結(jié)數(shù)據(jù)集主要特征的過程。
EDA 非常重要,因為如果你不熟悉正在處理的數(shù)據(jù)集,那么你將無法從該數(shù)據(jù)中推斷出某些內(nèi)容。然而,EDA通常需要花費大量時間。
但是,如果我告訴你 python 可以在一些庫的幫助下自動化 EDA 過程呢?
在本文中,我們將使用 「Sweetviz」 實現(xiàn) EDA 自動化。
它是一個 Python 庫,可以生成「漂亮的高密度可視化」效果,從而通過一行代碼啟動 EDA(探索性數(shù)據(jù)分析)。輸出是一個完全獨立的 HTML 應(yīng)用程序。
該系統(tǒng)是圍繞快速可視化目標(biāo)值和比較數(shù)據(jù)集而構(gòu)建的。其目標(biāo)是幫助快速分析目標(biāo)特征、訓(xùn)練與測試數(shù)據(jù)以及其他此類數(shù)據(jù)表征任務(wù)。
安裝庫
與任何其他 python 庫一樣,我們可以使用下面給出的 pip install 命令來安裝 sweetviz。
pip install sweetviz
分析數(shù)據(jù)集
讓我們使用來自 Kaggle 的鳶尾花數(shù)據(jù)集。
你可以從此處下載數(shù)據(jù)集文件 ( https://www.kaggle.com/arshid/iris-flower-dataset)
# Import sweetviz and pandas libraries import sweetviz as sv import pandas as pd # Now read the dataset using pd.read_csv() function data = pd.read_csv('IRIS.csv') # Split first 125 entries/rows into train data frame train = data.iloc[:125] # Split next rows from 125 until end into test data frame test = data.iloc[125:]
現(xiàn)在你可以使用 show_html() 方法將數(shù)據(jù)框的分析結(jié)果顯示為 HTML 文件。
report=sv.analyze(train) report.show_html()
現(xiàn)在,如果你想比較兩個數(shù)據(jù)幀(即訓(xùn)練集、測試集)之間的分析,你可以使用 sweetviz 庫中的 compare() 函數(shù)。
compare_report=sv.compare(train,test) compare_report.show_html()
如果你想比較兩個子群體之間的分析,那么你可以使用 sweetviz 庫中的 compare_intra() 函數(shù)。
請注意,在內(nèi)部,這會創(chuàng)建 2 個單獨的數(shù)據(jù)框來表示每個結(jié)果組。
compare_intra_report=sv.compare_intra(train,train['species']=='Iris-setosa',['setosa','other']) compare_intra_report.show_html()
更多的功能期待大家去嘗試,以上就是python Sweetviz探索性數(shù)據(jù)可視化分析庫使用特征詳解的詳細(xì)內(nèi)容,更多關(guān)于python Sweetviz庫的資料請關(guān)注腳本之家其它相關(guān)文章!
- Python Sweetviz輕松實現(xiàn)探索性數(shù)據(jù)分析
- python一行代碼就能實現(xiàn)數(shù)據(jù)分析的pandas-profiling庫
- Python數(shù)據(jù)分析庫PyGWalker的強(qiáng)大交互式功能界面探索
- 精選39道Python數(shù)據(jù)分析面試題提早備戰(zhàn)金三銀四
- Python數(shù)據(jù)分析從入門到進(jìn)階之分類算法全面教程
- 科學(xué)計算與數(shù)據(jù)分析利器Python數(shù)據(jù)分析庫Scipy使用詳解
- Python數(shù)據(jù)分析numpy文本數(shù)據(jù)讀取索引切片實例詳解
- Python數(shù)據(jù)分析numpy的Nan和Inf使用注意點詳解
- Python數(shù)據(jù)分析pandas之布爾索引使用詳解
相關(guān)文章
Python?PyQt5中窗口數(shù)據(jù)傳遞的示例詳解
開發(fā)應(yīng)用程序時,若只有一個窗口則只需關(guān)心這個窗口里面的各控件之間如何傳遞數(shù)據(jù)。如果程序有多個窗口,就要關(guān)心不同的窗口之間是如何傳遞數(shù)據(jù)。本文介紹了PyQt5中三種窗口數(shù)據(jù)傳遞,需要的可以了解一下2022-12-12python+pygame實現(xiàn)坦克大戰(zhàn)
這篇文章主要為大家詳細(xì)介紹了python+pygame實現(xiàn)坦克大戰(zhàn),具有一定的參考價值,感興趣的小伙伴們可以參考一下2019-09-09Python3 實現(xiàn)串口兩進(jìn)程同時讀寫
今天小編就為大家分享一篇Python3 實現(xiàn)串口兩進(jìn)程同時讀寫,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-06-06