欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python類別數(shù)據(jù)數(shù)字化LabelEncoder?VS?OneHotEncoder區(qū)別

 更新時(shí)間:2022年09月13日 17:24:45   作者:HZ在掘金  
這篇文章主要為大家介紹了機(jī)器學(xué)習(xí):數(shù)據(jù)預(yù)處理之將類別數(shù)據(jù)數(shù)字化的方法LabelEncoder?VS?OneHotEncoder區(qū)別詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪

LabelEncoder 和 OneHotEncoder 是什么

- 在數(shù)據(jù)處理過程中,我們有時(shí)需要對(duì)不連續(xù)的數(shù)字或者文本進(jìn)行數(shù)字化處理。
- 在使用 Python 進(jìn)行數(shù)據(jù)處理時(shí),用 encoder 來轉(zhuǎn)化 dummy variable(虛擬數(shù)據(jù))非常簡(jiǎn)便,encoder 可以將數(shù)據(jù)集中的文本轉(zhuǎn)化成0或1的數(shù)值。
- LabelEncoder 和 OneHotEncoder 是 scikit-learn 包中的兩個(gè)功能,可以實(shí)現(xiàn)上述的轉(zhuǎn)化過程。
- sklearn.preprocessing.LabelEncoder
- sklearn.preprocessing.OneHotEncoder 

數(shù)據(jù)集中的類別數(shù)據(jù)

在使用回歸模型和機(jī)器學(xué)習(xí)模型時(shí),所有的考察數(shù)據(jù)都是數(shù)值更容易得到好的結(jié)果。
因?yàn)榛貧w和機(jī)器學(xué)習(xí)都是基于數(shù)學(xué)函數(shù)方法的,所以當(dāng)我們要分析的數(shù)據(jù)集中出現(xiàn)了類別數(shù)據(jù)(categorical data),此時(shí)的數(shù)據(jù)是不理想的,因?yàn)槲覀儾荒苡脭?shù)學(xué)的方法處理它們。

例如,在處理男和女兩個(gè)性別數(shù)據(jù)時(shí),我們用0和1將其代替,再進(jìn)行分析。

由于這種情況的出現(xiàn),我們需要可以將文字?jǐn)?shù)字化的現(xiàn)成方法。

LabelEncoder 和 OneHotEncoder 的區(qū)別

具體代碼

import pandas as pd
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
from sklearn.cross_validation import train_test_split
# 讀取數(shù)據(jù)
data_df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/'
                 'breast-cancer-wisconsin/wdbc.data', header=None)
# 前面的數(shù)據(jù)是特征,最后一列是標(biāo)簽label
x, y = data_df.values[:, :-1], data_df.values[:, -1]
# 先實(shí)例化一個(gè)對(duì)象
encoder_x = LabelEncoder() 
# 對(duì)標(biāo)簽進(jìn)行類別數(shù)據(jù)數(shù)字化
y = encoder_x.fit_transform( y )

以上就是python 數(shù)據(jù)數(shù)字化的方法LabelEncoder VS OneHotEncoder區(qū)別的詳細(xì)內(nèi)容,更多關(guān)于LabelEncoder VS OneHotEncoder的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • python opencv人臉檢測(cè)提取及保存方法

    python opencv人臉檢測(cè)提取及保存方法

    今天小編就為大家分享一篇python opencv人臉檢測(cè)提取及保存方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2018-08-08
  • 用實(shí)例說明python的*args和**kwargs用法

    用實(shí)例說明python的*args和**kwargs用法

    python的*args和**kwargs如何用,看了下面的例子你就清楚了。
    2013-11-11
  • Pytorch中torch.flatten()和torch.nn.Flatten()實(shí)例詳解

    Pytorch中torch.flatten()和torch.nn.Flatten()實(shí)例詳解

    這篇文章主要給大家介紹了關(guān)于Pytorch中torch.flatten()和torch.nn.Flatten()的相關(guān)資料,文中通過實(shí)例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2022-02-02
  • Python執(zhí)行JS代碼的三種方式

    Python執(zhí)行JS代碼的三種方式

    以前的數(shù)據(jù)靠買,現(xiàn)在的數(shù)據(jù)靠爬”,越來越多的學(xué)者通過網(wǎng)絡(luò)爬蟲來獲取數(shù)據(jù),但是做爬蟲的人都知道,現(xiàn)在的很多網(wǎng)站都在和我們斗智斗勇,防護(hù)普遍越來越好,破解JS加密只是第一步,之后就是如何在我們的Python代碼中直接執(zhí)行JS,下面介紹一下幾種Python中執(zhí)行JS代碼的方法
    2024-01-01
  • Python3實(shí)現(xiàn)簡(jiǎn)單可學(xué)習(xí)的手寫體識(shí)別(實(shí)例講解)

    Python3實(shí)現(xiàn)簡(jiǎn)單可學(xué)習(xí)的手寫體識(shí)別(實(shí)例講解)

    下面小編就為大家?guī)硪黄狿ython3實(shí)現(xiàn)簡(jiǎn)單可學(xué)習(xí)的手寫體識(shí)別(實(shí)例講解)。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧
    2017-10-10
  • Python接口自動(dòng)化測(cè)試框架運(yùn)行原理及流程

    Python接口自動(dòng)化測(cè)試框架運(yùn)行原理及流程

    這篇文章主要介紹了Python接口自動(dòng)化測(cè)試框架運(yùn)行原理及流程,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-11-11
  • django fernet fields字段加密實(shí)踐詳解

    django fernet fields字段加密實(shí)踐詳解

    這篇文章主要介紹了django fernet fields字段加密實(shí)踐詳解,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-08-08
  • 一篇文章帶你順利通過Python OpenCV入門階段

    一篇文章帶你順利通過Python OpenCV入門階段

    這篇文章主要介紹了Python OpenCV的知識(shí)體系,文章中涉及到的知識(shí)點(diǎn)很多,需要了解這方面知識(shí)的小伙伴可以慢慢理解,慢慢學(xué)習(xí)
    2021-08-08
  • Python入門教程(七)Python數(shù)字類型

    Python入門教程(七)Python數(shù)字類型

    這篇文章主要介紹了Python入門教程(七)Python數(shù)字類型,Python是一門非常強(qiáng)大好用的語言,也有著易上手的特性,本文為入門教程,需要的朋友可以參考下
    2023-04-04
  • 用uWSGI和Nginx部署Flask項(xiàng)目的方法示例

    用uWSGI和Nginx部署Flask項(xiàng)目的方法示例

    這篇文章主要介紹了用uWSGI和Nginx部署Flask項(xiàng)目的方法示例,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧
    2019-05-05

最新評(píng)論