Python數(shù)據(jù)挖掘中常用的五種AutoEDA 工具總結
我們能否使用一些自動化工具代替人來完成數(shù)據(jù)分析的過程呢,現(xiàn)有一些成熟的 AutoEDA 工具可以一定程度上完成上述過程。本文中,我將盤點常見的 AutoEDA 工具,歡迎收藏學習,喜歡點贊支持,文末提供技術交流群,歡迎暢聊。
1、Pandas Profiling
https://pandas-profiling.github.io/pandas-profiling/docs/master/index.html
Pandas Profiling
是款比較成熟的工具,可以直接傳入DataFrame即可完成分析過程,將結果展示為HTML格式,同時分析功能也比較強大。
- 功能:字段類型分析、變量分布分析、相關性分析、缺失值分析、重復行分析
- 耗時:較少
2、AutoViz
https://github.com/AutoViML/AutoViz
AutoViz
是款美觀的數(shù)據(jù)分析工具,在進行可視化的同時將結果保存為圖片格式。
- 功能:相關性分析、數(shù)值變量箱線圖、數(shù)值變量分布圖
- 耗時:較多
3、Dataprep
Dataprep
是款比較靈活也比較強大的工具,也是筆者最喜歡的。它可以指定列進行分析,同時也可以在Notebook中進行交互式分析。
- 功能:字段類型分析、變量分布分析、相關性分析、缺失值分析、交互式分析。
- 耗時:較多
4、SweetViz
https://github.com/fbdesignpro/sweetviz
SweetViz
是款強大的數(shù)據(jù)分析工具,可以很好的分析訓練集和測試集,以及目標標簽與特征之間的關系。
- 功能:數(shù)據(jù)集對比分析、字段類型分析、變量分布分析、目標變量分析
- 耗時:中等
5、D-Tale
https://github.com/man-group/dtale
D-Tale
是款功能最為強大的數(shù)據(jù)分析工具,對單變量的分析過程支持比較好。
- 功能:字段類型分析、變量分布分析、相關性分析、缺失值分析、交互式分析。
- 耗時:中等
技術交流
歡迎轉(zhuǎn)載、收藏、有所收獲點贊支持一下!
到此這篇關于Python數(shù)據(jù)挖掘中常用的五種AutoEDA 工具總結的文章就介紹到這了,更多相關Python 數(shù)據(jù)挖掘內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
Queue 實現(xiàn)生產(chǎn)者消費者模型(實例講解)
下面小編就為大家?guī)硪黄猀ueue 實現(xiàn)生產(chǎn)者消費者模型(實例講解)。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2017-11-11Python實現(xiàn)新版正方系統(tǒng)滑動驗證碼識別
這篇文章主要介紹了基于Python實現(xiàn)新版正方系統(tǒng)滑動驗證碼識別算法和方案,文中示例代碼對我們的學習和工作有一定的幫助,感興趣的可以了解一下2021-12-12NumPy?與?Python?內(nèi)置列表計算標準差區(qū)別詳析
這篇文章主要介紹了NumPy與Python內(nèi)置列表計算標準差區(qū)別詳析,NumPy,是Numerical?Python的簡稱,用于高性能科學計算和數(shù)據(jù)分析的基礎包,更多相關內(nèi)容需要的朋友可以參考一下2022-07-07Python編程二分法實現(xiàn)冒泡算法+快速排序代碼示例
這篇文章主要介紹了Python編程二分法實現(xiàn)冒泡算法+快速排序代碼示例,具有一定借鑒價值,需要的朋友可以參考下2018-01-01