Python深度學習神經(jīng)網(wǎng)絡殘差塊
ResNet沿用VGG完整的KaTeX parse error: Undefined control sequence: \time at position 2: 3\̲t̲i̲m̲e̲3卷積層設計。殘差塊里首先有2個相同輸出通道數(shù)的KaTeX parse error: Undefined control sequence: \time at position 2: 3\̲t̲i̲m̲e̲3卷積層。每個卷積層后接一個批量歸一化層和ReLU激活函數(shù)。然后我們通過跨層數(shù)據(jù)通路,跳過這2個卷積運算,將輸入直接加在最后的ReLU激活函數(shù)前。這樣的設計要求2個卷積層的輸出與輸入形狀一樣,從而可以相加。如果想改變通道數(shù),就需要引入一個額外的 1 × 1 1\times1 1×1卷積層來講輸入變換成需要的形狀后再做相加運算。
殘差塊的實現(xiàn)如下:
import torch from torch import nn from torch.nn import functional as F from d2l import torch as d2l class Residual(nn.Module): def __init__(self, input_channels, num_channels, use_1x1conv=False, strides=1): super().__init__() self.conv1 = nn.Conv2d(input_channels, num_channels, kernel_size=3, padding=1, stride=strides) self.conv2 = nn.Conv2d(num_channels, num_channels, kernel_size=3, padding=1) if use_1x1conv: self.conv3 = nn.Conv2d(input_channels, num_channels, kernel_size=1, stride=strides) else: self.conv3 = None self.bn1 = nn.BatchNorm2d(num_channels) self.bn2 = nn.BatchNorm2d(num_channels) self.relu = nn.ReLU(inplace=True) def forward(self, X): Y = F.relu(self.bn1(self.conv1(X))) Y = self.bn2(self.conv2(Y)) if self.conv3: X = self.conv3(X) Y += X return F.relu(Y)
如下圖所示,此外碼生成兩種類型的網(wǎng)絡:一種是在use_1x1conv=False、應用ReLU非線性函數(shù)之前,將輸入添加到輸出。另一種是在use_1x1conv=True時,添加通過 1 × 1 卷積調(diào)整通道和分辨率。
下面我們來查看輸入和輸出形狀一致的情況。
blk = Residual(3, 3) X = torch.rand(4, 3, 6, 6) Y = blk(X) Y.shape
torch.Size([4, 3, 6, 6])
我們也可以在增加輸出通道數(shù)的同時,減半輸出的高和寬。
blk = Residual(3, 6, use_1x1conv=True, strides=2) blk(X).shape
torch.Size([4, 6, 3, 3])
ResNet模型
ResNet的前兩層為:在輸出通道數(shù)為64、步幅為2的 7 × 7 卷積層后,接步幅為2的 3 × 3 的最大匯聚層。不同之處在于ResNet的每個卷積層后增加了批量歸一化層。
b1 = nn.Sequential(nn.Conv2d(1, 64, kernel_size=7, stride=2, padding=3), nn.BatchNorm2d(64), nn.ReLU(), nn.MaxPool2d(kernel_size=3, stride=2, padding=1))
ResNet使用4個由殘差塊組成的模塊,每個模塊使用若干個同樣輸出通道數(shù)的殘差塊。第一個模塊的通道數(shù)同輸入通道數(shù)一致。由于之前已經(jīng)使用了步幅為2的最大匯聚層,所以無須減小高和寬。之后的每個模塊在第一個殘差塊里將上一個模塊的通道數(shù)翻倍,并將高和寬減半。
下面我們來實現(xiàn)這個模塊。注意,我們對第一個模塊做了特別處理。
def resnet_block(input_channels, num_channels, num_residuals, first_block=False): blk = [] for i in range(num_residuals): if i == 0 and not first_block: blk.append(Residual(input_channels, num_channels, use_1x1conv=True, strides=2)) else: blk.append(Residual(num_channels, num_channels)) return blk
接著在ResNet加入所有殘差塊,這里每個模塊使用2個殘差塊。
b2 = nn.Sequential(*resnet_block(64, 64, 2, first_block=True)) b3 = nn.Sequential(*resnet_block(64, 128, 2)) b4 = nn.Sequential(*resnet_block(128, 256, 2)) b5 = nn.Sequential(*resnet_block(256, 512, 2))
最后,在ResNet中加入全局平均匯聚層,以及全連接層輸出。
net = nn.Sequential(b1, b2, b3, b4, b5, nn.AdaptiveAvgPool2d((1, 1)), nn.Flatten(), nn.Linear(512, 10))
每個模塊有4個卷積層(不包括恒等映射的 1 × 1 1\times1 1×1卷積層)。加上第一個 7 × 7 7\times7 7×7卷積層和最后一個全連接層,共有18層。因此,這種模型通常被稱為ResNet-18。通過配置不同的通道數(shù)和模塊里的殘差塊數(shù)可以得到不同的ResNet模型,例如更深的152層的ResNet-152。ResNet的結(jié)構(gòu)更簡單,修改也更方便。這些因素都導致了ResNet迅速被廣泛使用。下圖描述了完整的ResNet-18。
在訓練ResNet之前,讓我們觀察一下ResNet中的不同模塊的輸入形狀是如何變化的。在之前的所有架構(gòu)中,分辨率降低,通道數(shù)量增加,直到全局平均匯聚層聚集所有特征。
X = torch.rand(size=(1, 1, 224, 224)) for layer in net: X = layer(X) print(layer.__class__.__name__,'output shape:\t', X.shape)
Sequential output shape: torch.Size([1, 64, 56, 56]) Sequential output shape: torch.Size([1, 64, 56, 56]) Sequential output shape: torch.Size([1, 128, 28, 28]) Sequential output shape: torch.Size([1, 256, 14, 14]) Sequential output shape: torch.Size([1, 512, 7, 7]) AdaptiveAvgPool2d output shape: torch.Size([1, 512, 1, 1]) Flatten output shape: torch.Size([1, 512]) Linear output shape: torch.Size([1, 10])
訓練模型
同之前一樣,我們在Fashion-MNIST數(shù)據(jù)集上訓練ResNet。
lr, num_epochs, batch_size = 0.05, 10, 256 train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, resize=96) d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())
loss 0.014, train acc 0.996, test acc 0.895 4680.2 examples/sec on cuda:0
以上就是Python深度學習神經(jīng)網(wǎng)絡殘差塊的詳細內(nèi)容,更多關于Python神經(jīng)網(wǎng)絡的資料請關注腳本之家其它相關文章!
相關文章
Python中動態(tài)創(chuàng)建類實例的方法
在Java中我們可以通過反射來根據(jù)類名創(chuàng)建類實例,那么在Python我們怎么實現(xiàn)類似功能呢?其實在Python有一個builtin函數(shù)import,我們可以使用這個函數(shù)來在運行時動態(tài)加載一些模塊2017-03-03python 數(shù)據(jù)分析實現(xiàn)長寬格式的轉(zhuǎn)換
這篇文章主要介紹了python 數(shù)據(jù)分析實現(xiàn)長寬格式的轉(zhuǎn)換,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-05-05哈工大自然語言處理工具箱之ltp在windows10下的安裝使用教程
這篇文章主要介紹了哈工大自然語言處理工具箱之ltp在windows10下的安裝使用教程,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-05-05