欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python使用dabl幾行代碼實(shí)現(xiàn)數(shù)據(jù)處理分析及ML自動(dòng)化

 更新時(shí)間:2021年11月22日 10:48:06   作者:Python學(xué)習(xí)與數(shù)據(jù)挖掘  
這篇文章主要為大家分享一個(gè)名為?dabl?的開(kāi)源?Python?工具包,它可以自動(dòng)化機(jī)器學(xué)習(xí)模型開(kāi)發(fā),包括數(shù)據(jù)預(yù)處理、特征可視化和分析、建模

數(shù)據(jù)科學(xué)模型開(kāi)發(fā)涉及各種組件,包括數(shù)據(jù)收集、數(shù)據(jù)處理、探索性數(shù)據(jù)分析、建模和部署。在訓(xùn)練機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型之前,必須清洗數(shù)據(jù)集并使其適合訓(xùn)練。通常這些過(guò)程是重復(fù)的,且占用了大部時(shí)間。

為了克服這個(gè)問(wèn)題,今天我分享一個(gè)名為 dabl 的開(kāi)源 Python 工具包,它可以自動(dòng)化機(jī)器學(xué)習(xí)模型開(kāi)發(fā),包括數(shù)據(jù)預(yù)處理、特征可視化和分析、建模。歡迎收藏學(xué)習(xí),喜歡點(diǎn)贊支持。

dabl

dabl 是一個(gè)數(shù)據(jù)分析基線庫(kù),可以讓機(jī)器學(xué)習(xí)建模更容易,它包括各種特性,我們只需幾行 Python 代碼就可以處理、分析和建模。

安裝

pip install dabl

1、數(shù)據(jù)預(yù)處理

dabl 在幾行 Python 代碼中自動(dòng)執(zhí)行數(shù)據(jù)預(yù)處理管道。dabl執(zhí)行的預(yù)處理步驟包括識(shí)別缺失值、刪除冗余特征以及理解特征的數(shù)據(jù)類型以進(jìn)一步執(zhí)行特征工程。

dabl檢測(cè)到的特征類型列表包括:

continuous

categorical

date

Dirty_float

Low_card_int

free_string

Useless

dabl 使用一行 Python 代碼將所有數(shù)據(jù)集特征自動(dòng)歸類為上述數(shù)據(jù)類型。

df_clean = dabl.clean(df, verbose=1)

原始 Titanic 數(shù)據(jù)集有12個(gè)特征,dabl 會(huì)自動(dòng)將它們分類為上述數(shù)據(jù)類型,以便進(jìn)行進(jìn)一步的特征工程。dabl還提供了根據(jù)需求更改任何特性的數(shù)據(jù)類型的功能。

db_clean = dabl.clean(db, type_hints={"Cabin": "categorical"})

可以使用 detect_types() 函數(shù)查看為每個(gè)特征分配的數(shù)據(jù)類型。

2、探索性數(shù)據(jù)分析

EDA 是數(shù)據(jù)科學(xué)模型開(kāi)發(fā)生命周期的重要組成部分。Seaborn、Matplotlib 等是執(zhí)行各種分析以更好地理解數(shù)據(jù)集的可視化庫(kù)。dabl 使 EDA 變得非常簡(jiǎn)單且節(jié)省大量時(shí)間。

dabl.plot(df_clean, target_col="Survived")

dabl 中 plot()函數(shù)可以通過(guò)繪制各種圖來(lái)實(shí)現(xiàn)可視化,包括:

  • 目標(biāo)分布的條形圖
  • 散點(diǎn)對(duì)圖
  • 線性判別分析

dabl 自動(dòng)對(duì)數(shù)據(jù)集執(zhí)行 PCA,并顯示數(shù)據(jù)集中所有特征的判別 PCA 圖。

3、建模

dabl 在訓(xùn)練數(shù)據(jù)上訓(xùn)練各種基線機(jī)器學(xué)習(xí)算法來(lái)加速建模工作流程,并返回性能最佳的模型。dabl 做出簡(jiǎn)單的假設(shè)并為基線模型生成指標(biāo)。

可以使用 dabl 中 SimpleClassifier() 函數(shù)進(jìn)行建模,它很快就可以返回最佳模型。

結(jié)論

Dabl 是一個(gè)方便的工具,它使機(jī)器學(xué)習(xí)更易于容易和快速,你只需幾行 Python 代碼就可以完成數(shù)據(jù)清理、特征可視化和基線模型的開(kāi)發(fā)。

如果你想了解更多,可以查看GitHub:? https://github.com/amueller/dabl

以上就是python使用dabl幾行代碼實(shí)現(xiàn)數(shù)據(jù)處理分析及ML自動(dòng)化的詳細(xì)內(nèi)容,更多關(guān)于dabl數(shù)據(jù)處理分析及ML自動(dòng)化的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • 局域網(wǎng)內(nèi)python socket實(shí)現(xiàn)windows與linux間的消息傳送

    局域網(wǎng)內(nèi)python socket實(shí)現(xiàn)windows與linux間的消息傳送

    這篇文章主要介紹了局域網(wǎng)內(nèi)python socket實(shí)現(xiàn)windows與linux間的消息傳送的相關(guān)知識(shí),非常不錯(cuò),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2019-04-04
  • 關(guān)于TensorBoard可視化不顯示數(shù)據(jù)問(wèn)題No scalar data was found

    關(guān)于TensorBoard可視化不顯示數(shù)據(jù)問(wèn)題No scalar data was&nbs

    這篇文章主要介紹了如何解決TensorBoard可視化不顯示數(shù)據(jù)問(wèn)題No scalar data was found,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-09-09
  • Python如何急速下載第三方庫(kù)詳解

    Python如何急速下載第三方庫(kù)詳解

    這篇文章主要給大家介紹了關(guān)于Python如何急速下載第三方庫(kù)的相關(guān)資料,文中通過(guò)圖文介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2020-11-11
  • Python中垃圾回收和del語(yǔ)句詳解

    Python中垃圾回收和del語(yǔ)句詳解

    Python語(yǔ)言默認(rèn)采用的垃圾收集機(jī)制是引用計(jì)數(shù)法,本文詳細(xì)的介紹了Python中垃圾回收和del語(yǔ)句詳解,對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2018-11-11
  • python制作一個(gè)桌面便簽軟件

    python制作一個(gè)桌面便簽軟件

    這篇文章主要介紹了python制作一個(gè)桌面便簽軟件分別給大家附上ubuntu和windows版的程序及源碼,有需要的小伙伴可以參考下。
    2015-08-08
  • 一分鐘帶你掌握Python中pip的安裝與使用方法

    一分鐘帶你掌握Python中pip的安裝與使用方法

    pip是什么?它是Python包管理工具,這個(gè)工具提供了對(duì)Python 包的查找、下載、安裝和卸載的功能,這篇文章主要介紹了pip的安裝與使用方法
    2021-08-08
  • Python Paramiko模塊中exec_command()和invoke_shell()兩種操作區(qū)別

    Python Paramiko模塊中exec_command()和invoke_shell()兩種操作區(qū)別

    invoke_shell 使用 SSH shell channel,而 exec_command 使用 SSH exec channel,本文主要介紹了Python Paramiko模塊中exec_command()和invoke_shell()兩種操作區(qū)別,具有一定的參考價(jià)值,感興趣的可以了解一下
    2024-02-02
  • python re的findall和finditer的區(qū)別詳解

    python re的findall和finditer的區(qū)別詳解

    這篇文章主要介紹了python re的findall和finditer的區(qū)別詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2020-11-11
  • python多線程與多進(jìn)程及其區(qū)別詳解

    python多線程與多進(jìn)程及其區(qū)別詳解

    這篇文章主要介紹了python多線程與多進(jìn)程及其區(qū)別詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-08-08
  • 簡(jiǎn)單介紹使用Python解析并修改XML文檔的方法

    簡(jiǎn)單介紹使用Python解析并修改XML文檔的方法

    這篇文章主要介紹了使用Python解析并修改XML文檔的方法,是Python入門學(xué)習(xí)中的基礎(chǔ)知識(shí),需要的朋友可以參考下
    2015-10-10

最新評(píng)論