腳本之家服務(wù)器常用軟件

快捷導航

關(guān)于keras中卷積層Conv2D的學習記錄

更新時間：2023年02月21日 16:53:50 作者：擺爛的CV工程師

這篇文章主要介紹了關(guān)于keras中卷積層Conv2D的學習記錄，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教

keras中卷積層Conv2D的學習

關(guān)于卷積的具體操作不細講，本文只是自己太懶了不想記手寫筆記。

由于自己接觸到的都是圖像

處理相關(guān)的工作，因此，在這里只介紹2D卷積。

keras.layers.convolutional.Conv2D(filters,kernel_size,strides(1,1),?
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? padding='valid',
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? data_format=None,
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? dilation_rate=(1,1),
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? activation=None,
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? use_bias=True,
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? kernel_initializer='glorot_uniform',
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? bias_initializer='zeros',
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? kernel_regularizer=None,
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? bias_regularizer=None,
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? activity_regularizer=None,
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? kernel_constraint=None,
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? bias_constraint=None)

此操作將二維向量進行卷積，當使用該層作為第一層時，應(yīng)提供input_shape參數(shù)。

參數(shù)

filters：卷積核的數(shù)目（即輸出的維度）。
kernel_size：單個整數(shù)或由兩個整數(shù)構(gòu)成的list/tuple，卷積核的寬度和長度。如為單個整數(shù)，則表示在各個空間維度的相同長度。
strides：單個整數(shù)或由兩個整數(shù)構(gòu)成的list/tuple，為卷積的步長。如為單個整數(shù)，則表示在各個空間維度的相同步長。任何不為1的strides均與任何不為1的dilation_rata均不兼容。
padding：補0策略，為“valid”, “same”。“valid”代表只進行有效的卷積，即對邊界數(shù)據(jù)不處理。“same”代表保留邊界處的卷積結(jié)果，通常會導致輸出shape與輸入shape相同。
activation：激活函數(shù)，為預(yù)定義的激活函數(shù)名（參考激活函數(shù)），或逐元素（element-wise）的Theano函數(shù)。如果不指定該參數(shù)，將不會使用任何激活函數(shù)（即使用線性激活函數(shù)：a(x)=x）。
dilation_rate：單個整數(shù)或由兩個個整數(shù)構(gòu)成的list/tuple，指定dilated convolution中的膨脹比例。任何不為1的dilation_rata均與任何不為1的strides均不兼容。
data_format：字符串，“channels_first”或“channels_last”之一，代表圖像的通道維的位置。該參數(shù)是Keras 1.x中的image_dim_ordering，“channels_last”對應(yīng)原本的“tf”，“channels_first”對應(yīng)原本的“th”。以128x128的RGB圖像為例，“channels_first”應(yīng)將數(shù)據(jù)組織為（3,128,128），而“channels_last”應(yīng)將數(shù)據(jù)組織為（128,128,3）。該參數(shù)的默認值是~/.keras/keras.json中設(shè)置的值，若從未設(shè)置過，則為“channels_last”。
use_bias：布爾值，是否使用偏置項。
kernel_initializer：權(quán)值初始化方法，為預(yù)定義初始化方法名的字符串，或用于初始化權(quán)重的初始化器。
bias_initializer：權(quán)值初始化方法，為預(yù)定義初始化方法名的字符串，或用于初始化權(quán)重的初始化器。
kernel_regularizer：施加在權(quán)重上的正則項，為Regularizer對象。
bias_regularizer：施加在偏置向量上的正則項，為Regularizer對象。
activity_regularizer：施加在輸出上的正則項，為Regularizer對象。
kernel_constraints：施加在權(quán)重上的約束項，為Constraints對象。
bias_constraints：施加在偏置上的約束項，為Constraints對象。

keras中conv2d,conv2dTranspose的Padding詳解

conv2d和conv2dTranspose屬于最常用的層，但在keras的實現(xiàn)中關(guān)于padding的部分有點模糊，周末趁著空閑做了一些嘗試，來實驗padding的valid和same參數(shù)在實際過程中如何操作的。

conv2D演示代碼

conv2D部分

v_input = np.ones([1,5,5,1])
kernel = np.ones([3,3])
stride = 1
model = Sequential()
model.add(Conv2D(1, kernel_size=(3, 3),
                 activation='relu',
                 padding="valid" ,  # "same"
                 strides = 1, 
                 # dilation_rate = 1,
                 kernel_initializer = keras.initializers.Ones(),
                 input_shape=v_input.shape[1:]))

其中stride可以嘗試多組測試

padding在valid 和 same 間切換測試

Conv2d演示結(jié)論

padding 為valid則不進行填充, 根據(jù)stride的滑動大小來做平移, 則:

output_shape = ceil( (input_shape - (kernel_size - 1)) / stride )

如果是same模式則會進行左右上下的補齊, 其中左,上依次補齊 flood (kernel_size -1 ) / 2 , 右下補齊ceil (( kernel_size - 1) /2 ) ,補齊后進行的操作就是類似valid下的滑動卷積

output_shape = ceil (input_shape / stride)

ceil表示上取整　
flood表示下取整

CONV2Dtranspose演示代碼

v_input = np.ones([1,5,5,1])
kernel = np.ones([3,3])
stride = 1
model = Sequential()
model.add(Conv2DTranspose(1, kernel_size=(3, 3),
                 activation='relu',
                 padding="valid" ,  # "same"
                 strides = 1, 
                 # dilation_rate = 1,
                 kernel_initializer = keras.initializers.Ones(),
                 input_shape=v_input.shape[1:]))

如果padding的設(shè)置為valid則,保持最小相交的原則上下左右均填充kernel_size大小，如果ｓｔｒｉｄｅ設(shè)置為非１，起實際的作用和dilation_rate一樣均是在矩陣中進行填充(實際滑動是永遠都是１) 具體填充出來的矩陣大小是 (input_size -1) * stride + 1 + 2 * (kernel_size - 1)

之后就是按照這個矩陣做著類似conv2d valid的卷積　則:

output_shape = (input_size -1) * stride + 1 + 2 * (kernel_size - 1) - (kernel_size -1) = (input_size - 1) * stride + kernel_size

在這里插入圖片描述

如果padding為same的話則output_shape = input_shape * stride

其中原始矩陣左上padding = ceil (( kernel_size ) /2 ) 　右下補齊 flood (( kernel_size ) /2 ) 　這里conv2d

總結(jié)

以上為個人經(jīng)驗，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

關(guān)于keras中卷積層Conv2D的學習記錄

目錄

keras中卷積層Conv2D的學習

參數(shù)

keras中conv2d,conv2dTranspose的Padding詳解

conv2D演示代碼

Conv2d演示結(jié)論

CONV2Dtranspose演示代碼

總結(jié)

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具