pandas?如何將字符串映射為數(shù)字
pandas 將字符串映射為數(shù)字
在有些數(shù)據(jù)集中,有些數(shù)據(jù)變量用字符串表示,但為了方便處理,往往想轉(zhuǎn)換為好處理的格式,這時候不一定要用one hot進行編碼,也可以直接轉(zhuǎn)成整數(shù):
test_df["xx"] = pd.factorize(test_df["xx"])[0].astype(int)
但是這樣映射的數(shù)字是從0開始的,如果有初始要求,可以對映射結(jié)果加上某個值,例如,把從0開始變?yōu)閺?5開始:
test_df["xx"] = test_df["xx"].add(15)
效果gift_cards["user_id"] = pd.factorize(gift_cards["user_id"])[0].astype(int):
user_id item_id ratings time
0 B001GXRQW0 APV13CM0919JD 1.0 1229644800
1 B001GXRQW0 A3G8U1G1V082SN 5.0 1229472000
2 B001GXRQW0 A11T2Q0EVTUWP 5.0 1229472000
3 B001GXRQW0 A9YKGBH3SV22C 5.0 1229472000
4 B001GXRQW0 A34WZIHVF3OKOL 1.0 1229472000
... ... ... ... ...
147189 B01H5PPJT4 A2K9WVQW9TLWNK 5.0 1536969600
147190 B01H5PPJT4 A149ALSR6TPGF7 4.0 1536278400
147191 B01H5PPJT4 A2Q066NZCQSCOR 5.0 1535500800
147192 B01H5PPJT4 A1KJLWCW7XBS8I 5.0 1534550400
147193 B01H5PPJT4 ANABUB0FRZXRM 5.0 1534204800
user_id item_id ratings time
0 0 APV13CM0919JD 1.0 1229644800
1 0 A3G8U1G1V082SN 5.0 1229472000
2 0 A11T2Q0EVTUWP 5.0 1229472000
3 0 A9YKGBH3SV22C 5.0 1229472000
4 0 A34WZIHVF3OKOL 1.0 1229472000
... ... ... ... ...
147189 858 A2K9WVQW9TLWNK 5.0 1536969600
147190 858 A149ALSR6TPGF7 4.0 1536278400
147191 858 A2Q066NZCQSCOR 5.0 1535500800
147192 858 A1KJLWCW7XBS8I 5.0 1534550400
147193 858 ANABUB0FRZXRM 5.0 1534204800
pandas 將某一列的字符值轉(zhuǎn)換為數(shù)字
使用map的方法就可以實現(xiàn)把某一列的字符類型的值轉(zhuǎn)換為數(shù)字。
class_mapping = {'A':0, 'B':1} data[class] = data[class].map(class_mapping)
首先定義一個字典,然后使用map方法就可以把某一列的字符類型的值轉(zhuǎn)換為數(shù)字。
好了,這就是對使用pandas把某一列的字符值轉(zhuǎn)換為數(shù)字的認識。
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python 帶星號(* 或 **)的函數(shù)參數(shù)詳解
這篇文章主要介紹了Python 帶星號(* 或 **)的函數(shù)參數(shù)詳解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2021-02-02python實現(xiàn)根據(jù)文件關(guān)鍵字進行切分為多個文件的示例
今天小編就為大家分享一篇python實現(xiàn)根據(jù)文件關(guān)鍵字進行切分為多個文件的示例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-12-12