pandas數(shù)據(jù)處理之標簽列字符轉(zhuǎn)數(shù)字的實現(xiàn)

更新時間：2021年03月18日 11:14:34 作者：wx740851326

這篇文章主要介紹了pandas數(shù)據(jù)處理之標簽列字符轉(zhuǎn)數(shù)字的實現(xiàn)方式，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

機器學習中，當我們在進行數(shù)據(jù)預處理的時候，對于標簽列非字符的數(shù)據(jù)，我們往往需要將其轉(zhuǎn)換成字符，因為有的算法可能不支持非數(shù)字類型來做特征。

那么怎么快捷地來著這個轉(zhuǎn)換呢，請看我的示例：

1.構建測試數(shù)據(jù)

import pandas as pd
array = ['good','bad','well','bad','good','good','well','good']

2.數(shù)據(jù)轉(zhuǎn)換下，并獲取標簽列的字典

df = pd.DataFrame(array,columns=['status'])
status_dict = df['status'].unique().tolist()

3.使用函數(shù)進行轉(zhuǎn)換

df['transfromed']=df['status'].apply(lambda x : status_dict.index(x))

這樣，就將標簽列處理好了哈

等用完之后，再轉(zhuǎn)回來

df['transfromed1']= df['transfromed'].apply(lambda x : status_dict[x])

補充：pandas factorize將字符串特征轉(zhuǎn)化為數(shù)字特征

將原始數(shù)據(jù)中的字符串特征轉(zhuǎn)化為模型可以識別的數(shù)字特征可是使用pandas自帶的factorzie方法。

原始數(shù)據(jù)的job特征值如下

都是字符串特征,無法用于訓練，當然可以單獨建立map硬編碼處理，但是pandas已經(jīng)封裝好了相應的方法。

data = pd.read_csv("data/test_set.csv")
data["job"] = pd.factorize(data["job"])[0].astype(np.uint16)

以上為個人經(jīng)驗，希望能給大家一個參考，也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方，望不吝賜教。

您可能感興趣的文章:

python函數(shù)的高級應用詳解
這篇文章主要為大家介紹了python函數(shù)的高級應用，具有一定的參考價值，感興趣的小伙伴們可以參考一下，希望能夠給你帶來幫助
2021-11-11
python實現(xiàn)會員信息管理系統(tǒng)(List)
這篇文章主要為大家詳細介紹了python實現(xiàn)會員信息管理系統(tǒng)，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2022-03-03
利用Rust實現(xiàn)Python加速的技巧分享
這篇文章主要想來和大家一起探討一下關于使用Rust對Python計算進行加速的問題,文中的示例代碼講解詳細,感興趣的小伙伴可以跟隨小編一起學習一下
2023-09-09
詳解Python中可散列的數(shù)據(jù)類型
在Python中，字典（dict）是一種常用的數(shù)據(jù)類型，其使用鍵（key）和值（value）來存儲和訪問數(shù)據(jù)，在字典中，鍵必須是可哈希（hashable）的類型，否則會導致運行時錯誤，因此，在Python中，有一些可散列的數(shù)據(jù)類型可以作為字典的鍵
2023-06-06
numpy 對矩陣中Nan的處理:采用平均值的方法
今天小編就為大家分享一篇numpy 對矩陣中Nan的處理:采用平均值的方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-10-10
python?pandas遍歷每行并累加進行條件過濾方式
這篇文章主要介紹了python?pandas遍歷每行并累加進行條件過濾方式，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2022-05-05
Python importlib動態(tài)導入模塊實現(xiàn)代碼
這篇文章主要介紹了Python importlib動態(tài)導入模塊實現(xiàn)代碼,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2020-04-04
python生成多個只含0,1元素的隨機數(shù)組或列表的實例
今天小編就為大家分享一篇python生成多個只含0,1元素的隨機數(shù)組或列表的實例，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-11-11
pandas中ix的使用詳細講解
這篇文章主要介紹了pandas中ix的使用詳細講解，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2020-03-03
python-opencv 中值濾波{cv2.medianBlur(src, ksize)}的用法
這篇文章主要介紹了python-opencv 中值濾波{cv2.medianBlur(src, ksize)}的用法，具有很好的參考價值，希望對大家有所幫助。
2021-06-06