欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python數(shù)據(jù)歸一化及三種方法詳解

 更新時(shí)間:2019年08月06日 10:42:22   作者:AiFool  
這篇文章主要介紹了python數(shù)據(jù)歸一化及三種方法詳解,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

數(shù)據(jù)標(biāo)準(zhǔn)化(歸一化)處理是數(shù)據(jù)挖掘的一項(xiàng)基礎(chǔ)工作,不同評(píng)價(jià)指標(biāo)往往具有不同的量綱和量綱單位,這樣的情況會(huì)影響到數(shù)據(jù)分析的結(jié)果,為了消除指標(biāo)之間的量綱影響,需要進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理,以解決數(shù)據(jù)指標(biāo)之間的可比性。原始數(shù)據(jù)經(jīng)過數(shù)據(jù)標(biāo)準(zhǔn)化處理后,各指標(biāo)處于同一數(shù)量級(jí),適合進(jìn)行綜合對(duì)比評(píng)價(jià)。以下是三種常用的歸一化方法:

min-max標(biāo)準(zhǔn)化(Min-Max Normalization)

也稱為離差標(biāo)準(zhǔn)化,是對(duì)原始數(shù)據(jù)的線性變換,使結(jié)果值映射到[0 , 1]之間。轉(zhuǎn)換函數(shù)如下: 

 

其中max為樣本數(shù)據(jù)的最大值,min為樣本數(shù)據(jù)的最小值。這種方法有個(gè)缺陷就是當(dāng)有新數(shù)據(jù)加入時(shí),可能導(dǎo)致max和min的變化,需要重新定義。

min-max標(biāo)準(zhǔn)化python代碼如下:

import numpy as np
 
arr = np.asarray([0, 10, 50, 80, 100])
for x in arr:
  x = float(x - np.min(arr))/(np.max(arr)- np.min(arr))
  print x
 
# output
# 0.0
# 0.1
# 0.5
# 0.8
# 1.0

使用這種方法的目的包括:

1、對(duì)于方差非常小的屬性可以增強(qiáng)其穩(wěn)定性;

2、維持稀疏矩陣中為0的條目。

下面將數(shù)據(jù)縮至0-1之間,采用MinMaxScaler函數(shù)

from sklearn import preprocessing  
 
import numpy as np 
 
X = np.array([[ 1., -1., 2.], 
 
       [ 2., 0., 0.], 
 
       [ 0., 1., -1.]]) 
 
min_max_scaler = preprocessing.MinMaxScaler() 
 
X_minMax = min_max_scaler.fit_transform(X)

最后輸出:

array([[ 0.5 , 0. , 1. ],
          [ 1. , 0.5 , 0.33333333], 
          [ 0. , 1. , 0. ]])

測(cè)試用例:

注意:這些變換都是對(duì)列進(jìn)行處理。

當(dāng)然,在構(gòu)造類對(duì)象的時(shí)候也可以直接指定最大最小值的范圍:feature_range=(min, max),此時(shí)應(yīng)用的公式變?yōu)椋?/p>

X_std=(X-X.min(axis=0))/(X.max(axis=0)-X.min(axis=0)) 
X_minmax=X_std/(X.max(axis=0)-X.min(axis=0))+X.min(axis=0))

Z-score標(biāo)準(zhǔn)化方法

也稱為均值歸一化(mean normaliztion), 給予原始數(shù)據(jù)的均值(mean)和標(biāo)準(zhǔn)差(standard deviation)進(jìn)行數(shù)據(jù)的標(biāo)準(zhǔn)化。經(jīng)過處理的數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布,即均值為0,標(biāo)準(zhǔn)差為1。轉(zhuǎn)化函數(shù)為: 

 

其中 μμ 為所有樣本數(shù)據(jù)的均值,σσ為所有樣本數(shù)據(jù)的標(biāo)準(zhǔn)差。

import numpy as np
 
arr = np.asarray([0, 10, 50, 80, 100])
for x in arr:
  x = float(x - arr.mean())/arr.std()
  print x
 
# output
# -1.24101045599
# -0.982466610991
# 0.0517087689995
# 0.827340303992
# 1.34442799399

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • 基于 Python 實(shí)踐感知器分類算法

    基于 Python 實(shí)踐感知器分類算法

    這篇文章主要介紹了基于 Python 實(shí)踐感知器分類算法的教程,幫助大家更好的利用python進(jìn)行機(jī)器學(xué)習(xí),感興趣的朋友可以了解下
    2021-01-01
  • python中如何使用虛擬環(huán)境

    python中如何使用虛擬環(huán)境

    這篇文章主要介紹了python中如何使用虛擬環(huán)境,幫助大家更好的理解和使用python,感興趣的朋友可以了解下
    2020-10-10
  • python把一個(gè)字符串切開的實(shí)例方法

    python把一個(gè)字符串切開的實(shí)例方法

    在本篇文章里小編給大家整理的是一篇關(guān)于python把一個(gè)字符串切開的實(shí)例方法,需要的朋友們可以學(xué)習(xí)參考下。
    2020-09-09
  • python使用matplotlib畫柱狀圖、散點(diǎn)圖

    python使用matplotlib畫柱狀圖、散點(diǎn)圖

    這篇文章主要為大家詳細(xì)介紹了python使用matplotlib畫柱狀圖、散點(diǎn)圖,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2019-03-03
  • Django權(quán)限控制的使用

    Django權(quán)限控制的使用

    這篇文章主要介紹了Django權(quán)限控制的使用,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-01-01
  • ?Python列表的切片取值詳解

    ?Python列表的切片取值詳解

    這篇文章主要介紹了?Python列表的切片取值詳解,文章通過圍繞主題展開詳細(xì)的內(nèi)容介紹,具有一定的參考價(jià)值,需要的小伙伴可以參考一下
    2022-09-09
  • pygame時(shí)序模塊time的具體使用

    pygame時(shí)序模塊time的具體使用

    Pygame Time模塊能夠幫助你更好地控制幀率和時(shí)間,從而增強(qiáng)游戲的可玩性,本文主要介紹了pygame時(shí)序模塊time的具體使用,具有一定的參考價(jià)值,感興趣的可以了解一下
    2023-12-12
  • Python將一個(gè)Excel拆分為多個(gè)Excel

    Python將一個(gè)Excel拆分為多個(gè)Excel

    這篇文章主要為大家詳細(xì)介紹了Python將一個(gè)Excel拆分為多個(gè)Excel,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-11-11
  • Python+Matplotlib繪制重疊柱狀圖

    Python+Matplotlib繪制重疊柱狀圖

    重疊柱狀圖?(Overlapped?Bar)?是一種比較圖,可以將兩個(gè)柱狀圖疊加在一起,顯示兩個(gè)相關(guān)變量之間的差異,所以本文就來用Matplotlib繪制一個(gè)簡(jiǎn)單的重疊柱狀圖吧
    2023-06-06
  • Python簡(jiǎn)易版停車管理系統(tǒng)

    Python簡(jiǎn)易版停車管理系統(tǒng)

    這篇文章主要為大家詳細(xì)介紹了Python如何實(shí)現(xiàn)簡(jiǎn)易版停車管理系統(tǒng),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2019-08-08

最新評(píng)論