pandas factorize實現(xiàn)將字符串特征轉(zhuǎn)化為數(shù)字特征
將原始數(shù)據(jù)中的字符串特征轉(zhuǎn)化為模型可以識別的數(shù)字特征可是使用pandas自帶的factorzie方法。
原始數(shù)據(jù)的job特征值如下
都是字符串特征,無法用于訓(xùn)練,當(dāng)然可以單獨建立map硬編碼處理,但是pandas已經(jīng)封裝好了相應(yīng)的方法。
data = pd.read_csv("data/test_set.csv") data["job"] = pd.factorize(data["job"])[0].astype(np.uint16)
以上這篇pandas factorize實現(xiàn)將字符串特征轉(zhuǎn)化為數(shù)字特征就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
50行Python代碼獲取高考志愿信息的實現(xiàn)方法
這篇文章主要介紹了50行Python代碼獲取高考志愿信息的實現(xiàn)方法,本文給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下2019-07-07python?opencv的imread方法無法讀取圖片問題
這篇文章主要介紹了python?opencv的imread方法無法讀取圖片問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-08-08python代碼實現(xiàn)TSNE降維數(shù)據(jù)可視化教程
今天小編就為大家分享一篇python代碼實現(xiàn)TSNE降維數(shù)據(jù)可視化教程,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-02-02一文帶你詳解Python中sys.executable函數(shù)的作用
sys.executable函數(shù)是用來獲取當(dāng)前Python解釋器的完整路徑的,本文主要介紹了一文帶你詳解Python中sys.executable函數(shù)的作用,具有一定的參考價值,感興趣的可以了解一下2024-03-03使用Python?http.server模塊共享文件的方法詳解
大家好,今天給大家介紹一下Python標(biāo)準(zhǔn)庫中的http.server模塊,這個模塊提供了一種簡單的方式來快速啟動一個HTTP服務(wù)器,文中給大家介紹了使用Python?http.server模塊共享文件的方法,需要的朋友可以參考下2024-05-05