對python sklearn one-hot編碼詳解
one-hot編碼的作用
使用one-hot編碼,將離散特征的取值擴(kuò)展到了歐式空間,離散特征的某個取值就對應(yīng)歐式空間的某個點(diǎn)
將離散特征通過one-hot編碼映射到歐式空間,是因?yàn)?,在回歸,分類,聚類等機(jī)器學(xué)習(xí)算法中,特征之間距離的計(jì)算或相似度的計(jì)算是非常重要的,而我們常用的距離或相似度的計(jì)算都是在歐式空間的相似度計(jì)算,計(jì)算余弦相似性,基于的就是歐式空間。
sklearn的一個例子
from sklearn import preprocessing enc = preprocessing.OneHotEncoder() enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]]) print(enc.n_values_)//每個特征對應(yīng)的最大位數(shù) print(enc.transform([[0,1,3]]).toarray()) print(enc.transform([[0,1,1]]).toarray())
上面代碼enc.fit()里有一個4行3列的矩陣
1、每一列對應(yīng)于一個樣本的特征序列,即一個樣本有三個特征
2、4行表明傳入了4個樣本
3、觀察每一列的值可以知道:第一個特征有兩個取值0,1;第二個特征有三個取值0,1,2;第三個特征有4個取值0,1,2,3
4、所以第一個特征的one-hot編碼是一個兩位的01串,第二個特征是一個三位的01串,第三個特征是一個4位的01串
以上這篇對python sklearn one-hot編碼詳解就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python使用matplotlib.pyplot畫熱圖和損失圖的代碼詳解
眾所周知,在完成論文相關(guān)工作時畫圖必不可少,如損失函數(shù)圖、熱力圖等是非常常見的圖,在本文中,總結(jié)了這兩個圖的畫法,下面給出了完整的代碼,開箱即用,感興趣的同學(xué)可以自己動手嘗試一下2023-09-09使用beaker讓Facebook的Bottle框架支持session功能
這篇文章主要介紹了使用beaker讓Facebook的Bottle框架支持session功能,session在Python的Django等框架中內(nèi)置但在Bottle中并沒有被集成,需要的朋友可以參考下2015-04-04Python數(shù)學(xué)建模庫StatsModels統(tǒng)計(jì)回歸簡介初識
這篇文章主要為大家介紹了Python數(shù)學(xué)建模庫StatsModels統(tǒng)計(jì)回歸的基本概念,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝打擊多多進(jìn)步2021-10-10Python 使用元類type創(chuàng)建類對象常見應(yīng)用詳解
這篇文章主要介紹了Python 使用元類type創(chuàng)建類對象,結(jié)合實(shí)例形式詳細(xì)分析了Python元類的概念、功能及元類type創(chuàng)建類對象的常見應(yīng)用技巧,需要的朋友可以參考下2019-10-10Python之——生成動態(tài)路由軌跡圖的實(shí)例
今天小編就為大家分享一篇Python之——生成動態(tài)路由軌跡圖的實(shí)例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-11-11