欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python深度學(xué)習(xí)pytorch神經(jīng)網(wǎng)絡(luò)匯聚層理解

 更新時(shí)間:2021年10月11日 11:59:26   作者:Supre_yuan  
通常當(dāng)我們處理圖像時(shí),我們希望逐漸降低隱藏表示的空間分辨率,聚集信息,這樣隨著我們?cè)谏窠?jīng)網(wǎng)絡(luò)層疊的上升,每個(gè)神經(jīng)元對(duì)其敏感的感受野(輸入)就越大

我們的機(jī)器學(xué)習(xí)任務(wù)通常會(huì)跟全局圖像的問(wèn)題有關(guān)(例如,“圖像是否包含一只貓呢?”),所以我們最后一層的神經(jīng)元應(yīng)該對(duì)整個(gè)輸入的全局敏感。通過(guò)逐漸聚合信息,生成越來(lái)越粗糙的映射,最終實(shí)現(xiàn)學(xué)習(xí)全局表示的目標(biāo),同時(shí)將卷積圖層的所有有時(shí)保留在中間層。

此外,當(dāng)檢測(cè)較底層的特征時(shí)(例如之前討論的邊緣),我們通常希望這些特征保持某種程度上的平移不變性。例如,如果我們拍攝黑白之間輪廓清晰的圖像X,并將整個(gè)圖像向右移動(dòng)一個(gè)像素,即Z[i, j] = X[i, j+1],則新圖像Z的輸出可能大不相同。而在現(xiàn)實(shí)中,隨著拍攝角度的移動(dòng),任何物體幾乎不可能發(fā)生在同一像素上。即使用三腳架拍攝一個(gè)靜止的物體,由于快門(mén)的移動(dòng)而引起的相機(jī)振動(dòng),可能會(huì)使所有物體左右移動(dòng)一個(gè)像素(除了高端相機(jī)配備了特殊功能來(lái)解決這個(gè)問(wèn)題)。

本節(jié)將介紹池化(pooling)層,它具有雙重目的:降低卷積層對(duì)位置的敏感性,同時(shí)降低對(duì)空間降采樣表示的敏感性。

最大匯聚層和平均匯聚層

與卷積層類(lèi)似,匯聚層運(yùn)算符由一個(gè)固定形狀的窗口組成,該窗口根據(jù)其步幅大小在輸入的所有區(qū)域上滑動(dòng),為固定形狀窗口(有時(shí)稱(chēng)為池化窗口)遍歷的每個(gè)位置計(jì)算一個(gè)輸出。然而,不同域卷積層的輸入與卷積核之間的互相關(guān)計(jì)算,匯聚層不包含參數(shù)。相反,池運(yùn)算符是確定性的,我們通常計(jì)算池化窗口中所有元素的最大值或平均值。這些操作分別稱(chēng)為最大匯聚層(maximum pooling)和平均匯聚層(average pooling)。

在這兩種情況下,與互相關(guān)運(yùn)算符一樣,池化窗口從輸入張量的左上角開(kāi)始,從左到右、從上到下的在輸入張量?jī)?nèi)移動(dòng)。

在這里插入圖片描述

填充和步幅

和先前一樣,我們可以通過(guò)填充和步幅以獲得所需的輸出形狀。

多個(gè)通道

在處理多通道輸入數(shù)據(jù)時(shí),匯聚層在每個(gè)輸入通道上單獨(dú)運(yùn)算,而不是像卷積層一樣在通道上對(duì)輸入進(jìn)行匯總。這意味著匯聚層的輸出通道數(shù)與輸入通道數(shù)相同。

以上就是Python深度學(xué)習(xí)pytorch神經(jīng)網(wǎng)絡(luò)匯聚層理解的詳細(xì)內(nèi)容,更多關(guān)于pytorch神經(jīng)網(wǎng)絡(luò)的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

最新評(píng)論