欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

基于數(shù)據(jù)歸一化以及Python實(shí)現(xiàn)方式

 更新時間:2018年07月11日 10:20:06   作者:迷茫的腳  
今天小編就為大家分享一篇基于數(shù)據(jù)歸一化以及Python實(shí)現(xiàn)方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧

數(shù)據(jù)歸一化:

數(shù)據(jù)的標(biāo)準(zhǔn)化是將數(shù)據(jù)按比例縮放,使之落入一個小的特定區(qū)間,去除數(shù)據(jù)的單位限制,將其轉(zhuǎn)化為無量綱的純數(shù)值,便于不同單位或量級的指標(biāo)能夠進(jìn)行比較和加權(quán)。

為什么要做歸一化:

1)加快梯度下降求最優(yōu)解的速度

如果兩個特征的區(qū)間相差非常大,其所形成的等高線非常尖,很有可能走“之字型”路線(垂直等高線走),從而導(dǎo)致需要迭代很多次才能收斂。

2)有可能提高精度

一些分類器需要計算樣本之間的距離,如果一個特征值域范圍非常大,那么距離計算就主要取決于這個特征,從而與實(shí)際情況相悖(比如這時實(shí)際情況是值域范圍小的特征更重要)。

歸一化類型

1)線性歸一化

這種歸一化比較適用在數(shù)值比較集中的情況,缺陷就是如果max和min不穩(wěn)定,很容易使得歸一化結(jié)果不穩(wěn)定,使得后續(xù)的效果不穩(wěn)定,實(shí)際使用中可以用經(jīng)驗(yàn)常量來代替max和min。

2)標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化

經(jīng)過處理的數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布,即均值為0,標(biāo)準(zhǔn)差為1。

3)非線性歸一化

經(jīng)常用在數(shù)據(jù)分化較大的場景,有些數(shù)值大,有些很小。通過一些數(shù)學(xué)函數(shù),將原始值進(jìn)行映射。該方法包括log、指數(shù)、反正切等。需要根據(jù)數(shù)據(jù)分布的情況,決定非線性函數(shù)的曲線。

log函數(shù):x = lg(x)/lg(max)

反正切函數(shù):x = atan(x)*2/pi

Python實(shí)現(xiàn)

線性歸一化

定義數(shù)組:x = numpy.array(x)

獲取二維數(shù)組列方向的最大值:x.max(axis = 0)

獲取二維數(shù)組列方向的最小值:x.min(axis = 0)

對二維數(shù)組進(jìn)行線性歸一化:

def max_min_normalization(data_value, data_col_max_values, data_col_min_values):
""" Data normalization using max value and min value

Args:
 data_value: The data to be normalized
 data_col_max_values: The maximum value of data's columns
 data_col_min_values: The minimum value of data's columns
"""
data_shape = data_value.shape
data_rows = data_shape[0]
data_cols = data_shape[1]

for i in xrange(0, data_rows, 1):
 for j in xrange(0, data_cols, 1):
  data_value[i][j] = \
   (data_value[i][j] - data_col_min_values[j]) / \
   (data_col_max_values[j] - data_col_min_values[j])

標(biāo)準(zhǔn)差歸一化

定義數(shù)組:x = numpy.array(x)

獲取二維數(shù)組列方向的均值:x.mean(axis = 0)

獲取二維數(shù)組列方向的標(biāo)準(zhǔn)差:x.std(axis = 0)

對二維數(shù)組進(jìn)行標(biāo)準(zhǔn)差歸一化:

def standard_deviation_normalization(data_value, data_col_means,
         data_col_standard_deviation):
""" Data normalization using standard deviation

Args:
 data_value: The data to be normalized
 data_col_means: The means of data's columns
 data_col_standard_deviation: The variance of data's columns
"""
data_shape = data_value.shape
data_rows = data_shape[0]
data_cols = data_shape[1]

for i in xrange(0, data_rows, 1):
 for j in xrange(0, data_cols, 1):
  data_value[i][j] = \
   (data_value[i][j] - data_col_means[j]) / \
   data_col_standard_deviation[j]

非線性歸一化(以lg為例)

定義數(shù)組:x = numpy.array(x)

獲取二維數(shù)組列方向的最大值:x.max(axis=0)

獲取二維數(shù)組每個元素的lg值:numpy.log10(x)

獲取二維數(shù)組列方向的最大值的lg值:numpy.log10(x.max(axis=0))

對二維數(shù)組使用lg進(jìn)行非線性歸一化:

def nonlinearity_normalization_lg(data_value_after_lg,
        data_col_max_values_after_lg):
""" Data normalization using lg

Args:
 data_value_after_lg: The data to be normalized
 data_col_max_values_after_lg: The maximum value of data's columns
"""

data_shape = data_value_after_lg.shape
data_rows = data_shape[0]
data_cols = data_shape[1]

for i in xrange(0, data_rows, 1):
 for j in xrange(0, data_cols, 1):
  data_value_after_lg[i][j] = \
   data_value_after_lg[i][j] / data_col_max_values_after_lg[j]

以上這篇基于數(shù)據(jù)歸一化以及Python實(shí)現(xiàn)方式就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • python爬蟲簡單的添加代理進(jìn)行訪問的實(shí)現(xiàn)代碼

    python爬蟲簡單的添加代理進(jìn)行訪問的實(shí)現(xiàn)代碼

    本文通過實(shí)例代碼給大家介紹了python爬蟲簡單的添加代理進(jìn)行訪問,代碼簡單易懂,非常不錯,具有一定的參考借鑒價值,需要的朋友可以參考下
    2019-04-04
  • python使用正則表達(dá)式(Regular Expression)方法超詳細(xì)

    python使用正則表達(dá)式(Regular Expression)方法超詳細(xì)

    這篇文章主要介紹了python使用正則表達(dá)式(Regular Expression)方法超詳細(xì),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-12-12
  • python 基于TCP協(xié)議的套接字編程詳解

    python 基于TCP協(xié)議的套接字編程詳解

    這篇文章主要介紹了python 基于TCP協(xié)議的套接字編程,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2019-06-06
  • Python在for循環(huán)中更改list值的方法【推薦】

    Python在for循環(huán)中更改list值的方法【推薦】

    這篇文章主要介紹了Python在for循環(huán)中更改list值的方法,非常不錯,具有一定的參考借鑒價值,需要的朋友可以參考下
    2018-08-08
  • 如何使用?Python為你的在線會議創(chuàng)建一個假的攝像頭

    如何使用?Python為你的在線會議創(chuàng)建一個假的攝像頭

    這篇文章主要介紹了使用?Python為你的在線會議創(chuàng)建一個假的攝像頭,在?Python?的幫助下,不再強(qiáng)制開啟攝像頭,將向你展示如何為你的在線會議創(chuàng)建一個假的攝像頭,需要的朋友可以參考下
    2022-08-08
  • python使用7z解壓apk包的方法

    python使用7z解壓apk包的方法

    這篇文章主要介紹了python使用7z解壓apk包的方法,涉及Python的shell命令調(diào)用技巧,非常具有實(shí)用價值,需要的朋友可以參考下
    2015-04-04
  • Vue的el-scrollbar實(shí)現(xiàn)自定義滾動

    Vue的el-scrollbar實(shí)現(xiàn)自定義滾動

    本篇文章給大家分享了Vue的el-scrollbar實(shí)現(xiàn)自定義滾動實(shí)現(xiàn)的過程和實(shí)例代碼,對此有需要的朋友可以參考下。
    2018-05-05
  • python RC4加密操作示例【測試可用】

    python RC4加密操作示例【測試可用】

    這篇文章主要介紹了python RC4加密操作,結(jié)合實(shí)例形式分析了python實(shí)現(xiàn)RC4加密功能的具體操作步驟與相關(guān)問題解決方法,需要的朋友可以參考下
    2019-09-09
  • 基于Python實(shí)現(xiàn)銀行卡識別的示例代碼

    基于Python實(shí)現(xiàn)銀行卡識別的示例代碼

    銀行卡識別是一個在金融、安全等領(lǐng)域具有重要應(yīng)用的問題,本文主要為大家介紹了如何使用Python和深度學(xué)習(xí)技術(shù)來實(shí)現(xiàn)銀行卡識別功能,需要的可以參考下
    2024-03-03
  • Python中bisect的用法

    Python中bisect的用法

    這篇文章主要介紹了Python中bisect的用法,主要講述了針對數(shù)組的插入及排序操作,非常具有實(shí)用價值,需要的朋友可以參考下
    2014-09-09

最新評論