python?AutoViz庫一行代碼實(shí)現(xiàn)可視化數(shù)據(jù)集
python AutoViz數(shù)據(jù)集可視化庫
今天給大家分享一個(gè)神奇的 python 庫,AutoViz。
https://github.com/AutoViML/AutoViz
通過這個(gè)庫,只需一行代碼即可可視化任何大小的數(shù)據(jù)集!
另外,你可以通過設(shè)置將這些交互式圖表保存為 HTML 文件。
借助 AutoViz,你可以輕松快速地為數(shù)據(jù)生成富有洞察力的可視化效果。無論你是數(shù)據(jù)分析的初學(xué)者還是專家,AutoViz 都可以幫助你探索數(shù)據(jù)并發(fā)現(xiàn)有價(jià)值的見解。
動(dòng)機(jī)
創(chuàng)建 AutoViz 的動(dòng)機(jī)源于對(duì)更高效、用戶友好且自動(dòng)化的數(shù)據(jù)可視化方法的需求。
可視化數(shù)據(jù)是數(shù)據(jù)分析過程中的關(guān)鍵步驟,因?yàn)樗梢詭椭脩衾斫鈹?shù)據(jù)中的模式、趨勢(shì)和關(guān)系。
然而,創(chuàng)建富有洞察力的可視化可能非常耗時(shí),并且需要各種繪圖庫和技術(shù)的專業(yè)知識(shí)。
AutoViz 通過提供易于使用的自動(dòng)化解決方案來解決這些挑戰(zhàn),以最少的努力生成有意義的可視化。
節(jié)省時(shí)間和精力:AutoViz 只需一行代碼即可生成多個(gè)有洞察力的圖表,從而簡化了可視化過程,無需為每個(gè)圖表編寫多行代碼。
處理大型數(shù)據(jù)集:AutoViz 旨在處理任何大小的數(shù)據(jù)集,在必要時(shí)對(duì)數(shù)據(jù)進(jìn)行智能采樣,以確??焖儆行У厣煽梢暬Ч粫?huì)影響洞察力。
民主化數(shù)據(jù)科學(xué):AutoViz 通過抽象化各種繪圖庫的復(fù)雜性,使更廣泛的受眾(包括數(shù)據(jù)分析的非專家和初學(xué)者)能夠訪問數(shù)據(jù)可視化。
自動(dòng)化 EDA:AutoViz 現(xiàn)在可以自動(dòng)分析并修復(fù)數(shù)據(jù)集中的數(shù)據(jù)質(zhì)量問題。這將幫助用戶快速將見解轉(zhuǎn)化為行動(dòng),而無需手動(dòng)分析每個(gè)變量。
定制和交互性:AutoViz 提供各種定制選項(xiàng),使用戶能夠根據(jù)自己的特定需求和偏好定制生成的可視化效果。此外,借助 Bokeh 等交互式圖表格式,用戶可以更動(dòng)態(tài)地探索數(shù)據(jù)。
總之,AutoViz 背后的動(dòng)機(jī)是使數(shù)據(jù)可視化更加高效、易于訪問和自動(dòng)化,使用戶能夠快速從數(shù)據(jù)中獲得有價(jià)值的見解,并專注于制定數(shù)據(jù)驅(qū)動(dòng)的決策。
安裝
可以直接使用 pip 進(jìn)行安裝。
pip install autoviz
導(dǎo)入庫
import pandas as pd import numpy as np #加載Autoviz from autoviz import AutoViz_Class %matplotlib inline AV = AutoViz_Class()
加載數(shù)據(jù)
你可以使用自己的數(shù)據(jù)集,我這里使用的是汽車數(shù)據(jù)集,如果需要可以私信我獲取。
filename = "Cars Data.csv" target_variable = "Horsepower"
可視化
下面,我們通過一行代碼,來執(zhí)行可視化。
dft = AV.AutoViz(
filename,
sep=",",
depVar=target_variable,
dfte=None,
header=0,
verbose=2,
lowess=False,
chart_format="svg",
max_rows_analyzed=500,
max_cols_analyzed=20,
save_plot_dir=None
)首先,你可以得到一份包括各個(gè)字段的數(shù)據(jù)質(zhì)量報(bào)告。

你還可以看到不同的可視化效果,如下圖所示。

你還可以將圖表格式保存為 HTML,以實(shí)現(xiàn)交互式可視化。

當(dāng)你單擊文件時(shí),你將被重定向到一個(gè)頁面,該頁面允許你進(jìn)行動(dòng)態(tài)和交互式可視化。

如果你只想查看數(shù)據(jù)質(zhì)量問題,你可以通過如下代碼來實(shí)現(xiàn)。
from autoviz import data_cleaning_suggestions data_cleaning_suggestions(df)
自動(dòng)修復(fù)
你可以使用 AutoViz 中的 FixDQ 自動(dòng)修復(fù)數(shù)據(jù)質(zhì)量問題。
from autoviz import FixDQ fixdq = FixDQ()
可以快速查看問題(重復(fù)行的示例)
fixdq.detect_duplicates(df)

如果你想要快速修復(fù),只需編寫一行代碼即可!
fixdq.fit_transform(df)

AutoViz 是一個(gè)優(yōu)秀的庫,它不僅允許以交互式和動(dòng)態(tài)的方式可視化數(shù)據(jù),而且除了提供快速修復(fù)之外還顯示數(shù)據(jù)質(zhì)量問題。
以上就是python AutoViz庫一行代碼實(shí)現(xiàn)可視化數(shù)據(jù)集的詳細(xì)內(nèi)容,更多關(guān)于python AutoViz數(shù)據(jù)集可視化的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
對(duì)Python生成漢字字庫文字,以及轉(zhuǎn)換為文字圖片的實(shí)例詳解
今天小編就為大家分享一篇對(duì)Python生成漢字字庫文字,以及轉(zhuǎn)換為文字圖片的實(shí)例詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-01-01
Python中使用ConfigParser解析ini配置文件實(shí)例
這篇文章主要介紹了Python中使用ConfigParser解析ini配置文件實(shí)例,本文給出了創(chuàng)建和讀取ini文件的例子,需要的朋友可以參考下2014-08-08
Python+Selenium+Webdriver實(shí)現(xiàn)自動(dòng)執(zhí)行微軟獎(jiǎng)勵(lì)積分腳本
這篇文章主要為大家詳細(xì)介紹了如何利用Python+Selenium+Webdriver實(shí)現(xiàn)自動(dòng)執(zhí)行微軟獎(jiǎng)勵(lì)積分腳本,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以了解一下2023-02-02
Flask框架中密碼的加鹽哈希加密和驗(yàn)證功能的用法詳解
加鹽加密就是在加密時(shí)混入一段隨機(jī)字符串,這段字符串便被稱為"鹽值",這里我們來看一下Python的Flask框架中密碼的加鹽哈希加密和驗(yàn)證功能的用法詳解:2016-06-06
Python 利用郵件系統(tǒng)完成遠(yuǎn)程控制電腦的實(shí)現(xiàn)(關(guān)機(jī)、重啟等)
這篇文章主要介紹了Python 利用郵件系統(tǒng)完成遠(yuǎn)程控制電腦(關(guān)機(jī)、重啟等),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-11-11
Django制作簡易注冊(cè)登錄系統(tǒng)的實(shí)現(xiàn)示例
本文介紹了如何使用Django搭建一個(gè)簡易的注冊(cè)登錄系統(tǒng),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2024-11-11
python同時(shí)遍歷數(shù)組的索引和值的實(shí)例
今天小編就為大家分享一篇python同時(shí)遍歷數(shù)組的索引和值的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-11-11

