pandas使用get_dummies進(jìn)行one-hot編碼的方法
離散特征的編碼分為兩種情況:
1、離散特征的取值之間沒(méi)有大小的意義,比如color:[red,blue],那么就使用one-hot編碼
2、離散特征的取值有大小的意義,比如size:[X,XL,XXL],那么就使用數(shù)值的映射{X:1,XL:2,XXL:3}
使用pandas可以很方便的對(duì)離散型特征進(jìn)行one-hot編碼
import pandas as pd df = pd.DataFrame([ ['green', 'M', 10.1, 'class1'], ['red', 'L', 13.5, 'class2'], ['blue', 'XL', 15.3, 'class1']]) df.columns = ['color', 'size', 'prize', 'class label'] size_mapping = { 'XL': 3, 'L': 2, 'M': 1} df['size'] = df['size'].map(size_mapping) class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))} df['class label'] = df['class label'].map(class_mapping)
說(shuō)明:對(duì)于有大小意義的離散特征,直接使用映射就可以了,{'XL':3,'L':2,'M':1}
Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies進(jìn)行one-hot編碼
pd.get_dummies(df)
以上這篇pandas使用get_dummies進(jìn)行one-hot編碼的方法就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
基于Python實(shí)現(xiàn)煙花效果的示例代碼
這篇文章主要為大家詳細(xì)介紹了如何利用Python制作出煙花的效果,文中的示例代碼講解詳細(xì),對(duì)我們學(xué)習(xí)Python有一定幫助,需要的可以參考一下2022-06-06python 實(shí)現(xiàn)按對(duì)象傳值
今天小編就為大家分享一篇python 實(shí)現(xiàn)按對(duì)象傳值,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-12-12python卸載numpy出現(xiàn)WinError:拒絕訪問(wèn)的解決方案
這篇文章主要介紹了python卸載numpy出現(xiàn)WinError:拒絕訪問(wèn)的解決方案,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-08-08Django框架基礎(chǔ)模板標(biāo)簽與filter使用方法詳解
這篇文章主要介紹了Django框架基礎(chǔ)模板標(biāo)簽與filter使用方法,簡(jiǎn)單分析了Django模板基本語(yǔ)法、函數(shù)與自定義filter相關(guān)使用技巧,需要的朋友可以參考下2019-07-07如何使用 Python 中的功能和庫(kù)創(chuàng)建 n-gram
在計(jì)算語(yǔ)言學(xué)中,n-gram 對(duì)于語(yǔ)言處理、上下文和語(yǔ)義分析非常重要,它們是從令牌字符串中相鄰的連續(xù)單詞序列,本文將討論如何使用 Python 中的功能和庫(kù)創(chuàng)建 n-gram,感興趣的朋友一起看看吧2023-09-09