欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

pandas數(shù)據(jù)處理之 標(biāo)簽列字符轉(zhuǎn)數(shù)字的實現(xiàn)

 更新時間:2021年03月18日 11:14:34   作者:wx740851326  
這篇文章主要介紹了pandas數(shù)據(jù)處理之 標(biāo)簽列字符轉(zhuǎn)數(shù)字的實現(xiàn)方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧

機器學(xué)習(xí)中,當(dāng)我們在進行數(shù)據(jù)預(yù)處理的時候,對于標(biāo)簽列非字符的數(shù)據(jù),我們往往需要將其轉(zhuǎn)換成字符,因為有的算法可能不支持非數(shù)字類型來做特征。

那么怎么快捷地來著這個轉(zhuǎn)換呢,請看我的示例:

1.構(gòu)建測試數(shù)據(jù)

import pandas as pd
array = ['good','bad','well','bad','good','good','well','good']

2.數(shù)據(jù)轉(zhuǎn)換下,并獲取標(biāo)簽列的字典

df = pd.DataFrame(array,columns=['status'])
status_dict = df['status'].unique().tolist()

3.使用函數(shù)進行轉(zhuǎn)換

df['transfromed']=df['status'].apply(lambda x : status_dict.index(x))

這樣,就將標(biāo)簽列處理好了哈

等用完之后,再轉(zhuǎn)回來

df['transfromed1']= df['transfromed'].apply(lambda x : status_dict[x])

補充:pandas factorize將字符串特征轉(zhuǎn)化為數(shù)字特征

將原始數(shù)據(jù)中的字符串特征轉(zhuǎn)化為模型可以識別的數(shù)字特征可是使用pandas自帶的factorzie方法。

原始數(shù)據(jù)的job特征值如下

都是字符串特征,無法用于訓(xùn)練,當(dāng)然可以單獨建立map硬編碼處理,但是pandas已經(jīng)封裝好了相應(yīng)的方法。

data = pd.read_csv("data/test_set.csv")
data["job"] = pd.factorize(data["job"])[0].astype(np.uint16)

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。

相關(guān)文章

  • python函數(shù)的高級應(yīng)用詳解

    python函數(shù)的高級應(yīng)用詳解

    這篇文章主要為大家介紹了python函數(shù)的高級應(yīng)用,具有一定的參考價值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來幫助
    2021-11-11
  • python實現(xiàn)會員信息管理系統(tǒng)(List)

    python實現(xiàn)會員信息管理系統(tǒng)(List)

    這篇文章主要為大家詳細介紹了python實現(xiàn)會員信息管理系統(tǒng),文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2022-03-03
  • 利用Rust實現(xiàn)Python加速的技巧分享

    利用Rust實現(xiàn)Python加速的技巧分享

    這篇文章主要想來和大家一起探討一下關(guān)于使用Rust對Python計算進行加速的問題,文中的示例代碼講解詳細,感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下
    2023-09-09
  • 詳解Python中可散列的數(shù)據(jù)類型

    詳解Python中可散列的數(shù)據(jù)類型

    在Python中,字典(dict)是一種常用的數(shù)據(jù)類型,其使用鍵(key)和值(value)來存儲和訪問數(shù)據(jù),在字典中,鍵必須是可哈希(hashable)的類型,否則會導(dǎo)致運行時錯誤,因此,在Python中,有一些可散列的數(shù)據(jù)類型可以作為字典的鍵
    2023-06-06
  • numpy 對矩陣中Nan的處理:采用平均值的方法

    numpy 對矩陣中Nan的處理:采用平均值的方法

    今天小編就為大家分享一篇numpy 對矩陣中Nan的處理:采用平均值的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-10-10
  • python?pandas遍歷每行并累加進行條件過濾方式

    python?pandas遍歷每行并累加進行條件過濾方式

    這篇文章主要介紹了python?pandas遍歷每行并累加進行條件過濾方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-05-05
  • Python importlib動態(tài)導(dǎo)入模塊實現(xiàn)代碼

    Python importlib動態(tài)導(dǎo)入模塊實現(xiàn)代碼

    這篇文章主要介紹了Python importlib動態(tài)導(dǎo)入模塊實現(xiàn)代碼,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2020-04-04
  • python生成多個只含0,1元素的隨機數(shù)組或列表的實例

    python生成多個只含0,1元素的隨機數(shù)組或列表的實例

    今天小編就為大家分享一篇python生成多個只含0,1元素的隨機數(shù)組或列表的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-11-11
  • pandas中ix的使用詳細講解

    pandas中ix的使用詳細講解

    這篇文章主要介紹了pandas中ix的使用詳細講解,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-03-03
  • python-opencv 中值濾波{cv2.medianBlur(src, ksize)}的用法

    python-opencv 中值濾波{cv2.medianBlur(src, ksize)}的用法

    這篇文章主要介紹了python-opencv 中值濾波{cv2.medianBlur(src, ksize)}的用法,具有很好的參考價值,希望對大家有所幫助。
    2021-06-06

最新評論