基于pandas將類別屬性轉(zhuǎn)化為數(shù)值屬性的方法
離散特征的編碼分為兩種情況:
1、離散特征的取值之間沒有大小的意義,比如color:[red,blue],那么就使用one-hot編碼
2、離散特征的取值有大小的意義,比如size:[X,XL,XXL],那么就使用數(shù)值的映射{X:1,XL:2,XXL:3}
使用pandas可以很方便的對離散型特征進行one-hot編碼
import pandas as pd df = pd.DataFrame([ ['green', 'M', 10.1, 'class1'], ['red', 'L', 13.5, 'class2'], ['blue', 'XL', 15.3, 'class1']]) df.columns = ['color', 'size', 'prize', 'class label'] size_mapping = { 'XL': 3, 'L': 2, 'M': 1} df['size'] = df['size'].map(size_mapping) class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))} df['class label'] = df['class label'].map(class_mapping)
說明:對于有大小意義的離散特征,直接使用映射就可以了,{‘XL':3,'L':2,'M':1 }
Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies進行one-hot
編碼
pd.get_dummies(df)
以上這篇基于pandas將類別屬性轉(zhuǎn)化為數(shù)值屬性的方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python編程實現(xiàn)刪除VC臨時文件及Debug目錄的方法
這篇文章主要介紹了Python編程實現(xiàn)刪除VC臨時文件及Debug目錄的方法,涉及Python針對文件與目錄的遍歷、刪除等相關(guān)操作技巧,需要的朋友可以參考下2017-03-03python基于itchat實現(xiàn)微信群消息同步機器人
本篇文章主要介紹了python基于itchat實現(xiàn)微信群消息同步機器人,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2017-02-02Python在內(nèi)網(wǎng)安裝python第三方包(庫)的方法
日常我們工作的計算機環(huán)境是內(nèi)網(wǎng),做項目需要安裝python?第三方庫,在外網(wǎng)一般使用"pip?install?包名"很快就安裝上了,但是在內(nèi)網(wǎng)無法連接pypi網(wǎng)站或者國內(nèi)鏡像,那該如何安裝呢,下面小編給大家?guī)砹薖ython如何在內(nèi)網(wǎng)安裝python第三方包庫,感興趣的朋友一起看看吧2024-01-01使用Fastapi打包exe后無限啟動導(dǎo)致死機的解決辦法
將 fastapi 服務(wù)打包成 exe 后雙擊執(zhí)行,命令行中不斷創(chuàng)建服務(wù)導(dǎo)致cpu吃滿,最后死機,所以本文給大家介紹了Fastapi打包exe后無限啟動導(dǎo)致死機的解決辦法,需要的朋友可以參考下2024-03-03Linux RedHat下安裝Python2.7開發(fā)環(huán)境
這篇文章主要為大家詳細介紹了Linux RedHat下安裝Python2.7、pip、ipython環(huán)境、eclipse和PyDev環(huán)境,具有一定的參考價值,感興趣的小伙伴們可以參考一下2017-05-05