快捷導(dǎo)航

Python深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)殘差塊

更新時(shí)間：2021年10月11日 11:04:35 作者：Supre_yuan

這篇文章主要為大家介紹了Python深度學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)殘差塊示例詳解有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進(jìn)步

ResNet沿用VGG完整的KaTeX parse error: Undefined control sequence: \time at position 2: 3\̲t̲i̲m̲e̲3卷積層設(shè)計(jì)。殘差塊里首先有2個(gè)相同輸出通道數(shù)的KaTeX parse error: Undefined control sequence: \time at position 2: 3\̲t̲i̲m̲e̲3卷積層。每個(gè)卷積層后接一個(gè)批量歸一化層和ReLU激活函數(shù)。然后我們通過跨層數(shù)據(jù)通路，跳過這2個(gè)卷積運(yùn)算，將輸入直接加在最后的ReLU激活函數(shù)前。這樣的設(shè)計(jì)要求2個(gè)卷積層的輸出與輸入形狀一樣，從而可以相加。如果想改變通道數(shù)，就需要引入一個(gè)額外的 1 × 1 1\times1 1×1卷積層來講輸入變換成需要的形狀后再做相加運(yùn)算。

殘差塊的實(shí)現(xiàn)如下：

import torch
from torch import nn
from torch.nn import functional as F
from d2l import torch as d2l

class Residual(nn.Module):
	def __init__(self, input_channels, num_channels, use_1x1conv=False, strides=1):
	super().__init__()
	self.conv1 = nn.Conv2d(input_channels, num_channels, kernel_size=3, padding=1, stride=strides)
	self.conv2 = nn.Conv2d(num_channels, num_channels, kernel_size=3, padding=1)

	if use_1x1conv:
		self.conv3 = nn.Conv2d(input_channels, num_channels, kernel_size=1, stride=strides)
	else:
		self.conv3 = None
	self.bn1 = nn.BatchNorm2d(num_channels)
	self.bn2 = nn.BatchNorm2d(num_channels)
	self.relu = nn.ReLU(inplace=True)

def forward(self, X):
	Y = F.relu(self.bn1(self.conv1(X)))
	Y = self.bn2(self.conv2(Y))
	if self.conv3:
		X = self.conv3(X)
	Y += X
	return F.relu(Y)

如下圖所示，此外碼生成兩種類型的網(wǎng)絡(luò)：一種是在use_1x1conv=False、應(yīng)用ReLU非線性函數(shù)之前，將輸入添加到輸出。另一種是在use_1x1conv=True時(shí)，添加通過 1 × 1 卷積調(diào)整通道和分辨率。

在這里插入圖片描述

下面我們來查看輸入和輸出形狀一致的情況。

blk = Residual(3, 3)
X = torch.rand(4, 3, 6, 6)
Y = blk(X)
Y.shape

torch.Size([4, 3, 6, 6])

我們也可以在增加輸出通道數(shù)的同時(shí)，減半輸出的高和寬。

blk = Residual(3, 6, use_1x1conv=True, strides=2)
blk(X).shape

torch.Size([4, 6, 3, 3])

ResNet模型

ResNet的前兩層為：在輸出通道數(shù)為64、步幅為2的 7 × 7 卷積層后，接步幅為2的 3 × 3 的最大匯聚層。不同之處在于ResNet的每個(gè)卷積層后增加了批量歸一化層。

b1 = nn.Sequential(nn.Conv2d(1, 64, kernel_size=7, stride=2, padding=3),
				   nn.BatchNorm2d(64), nn.ReLU(),
				   nn.MaxPool2d(kernel_size=3, stride=2, padding=1))

ResNet使用4個(gè)由殘差塊組成的模塊，每個(gè)模塊使用若干個(gè)同樣輸出通道數(shù)的殘差塊。第一個(gè)模塊的通道數(shù)同輸入通道數(shù)一致。由于之前已經(jīng)使用了步幅為2的最大匯聚層，所以無須減小高和寬。之后的每個(gè)模塊在第一個(gè)殘差塊里將上一個(gè)模塊的通道數(shù)翻倍，并將高和寬減半。

下面我們來實(shí)現(xiàn)這個(gè)模塊。注意，我們對(duì)第一個(gè)模塊做了特別處理。

def resnet_block(input_channels, num_channels, num_residuals, first_block=False):
	blk = []
	for i in range(num_residuals):
		if i == 0 and not first_block:
			blk.append(Residual(input_channels, num_channels, use_1x1conv=True, strides=2))
		else:
			blk.append(Residual(num_channels, num_channels))
	return blk

接著在ResNet加入所有殘差塊，這里每個(gè)模塊使用2個(gè)殘差塊。

b2 = nn.Sequential(*resnet_block(64, 64, 2, first_block=True))
b3 = nn.Sequential(*resnet_block(64, 128, 2))
b4 = nn.Sequential(*resnet_block(128, 256, 2))
b5 = nn.Sequential(*resnet_block(256, 512, 2))

最后，在ResNet中加入全局平均匯聚層，以及全連接層輸出。

net = nn.Sequential(b1, b2, b3, b4, b5,
					nn.AdaptiveAvgPool2d((1, 1)),
					nn.Flatten(), nn.Linear(512, 10))

每個(gè)模塊有4個(gè)卷積層（不包括恒等映射的 1 × 1 1\times1 1×1卷積層）。加上第一個(gè) 7 × 7 7\times7 7×7卷積層和最后一個(gè)全連接層，共有18層。因此，這種模型通常被稱為ResNet-18。通過配置不同的通道數(shù)和模塊里的殘差塊數(shù)可以得到不同的ResNet模型，例如更深的152層的ResNet-152。ResNet的結(jié)構(gòu)更簡單，修改也更方便。這些因素都導(dǎo)致了ResNet迅速被廣泛使用。下圖描述了完整的ResNet-18。

在這里插入圖片描述

在訓(xùn)練ResNet之前，讓我們觀察一下ResNet中的不同模塊的輸入形狀是如何變化的。在之前的所有架構(gòu)中，分辨率降低，通道數(shù)量增加，直到全局平均匯聚層聚集所有特征。

X = torch.rand(size=(1, 1, 224, 224))
for layer in net:
	X = layer(X)
	print(layer.__class__.__name__,'output shape:\t', X.shape)

Sequential output shape: torch.Size([1, 64, 56, 56])
Sequential output shape: torch.Size([1, 64, 56, 56])
Sequential output shape: torch.Size([1, 128, 28, 28])
Sequential output shape: torch.Size([1, 256, 14, 14])
Sequential output shape: torch.Size([1, 512, 7, 7])
AdaptiveAvgPool2d output shape: torch.Size([1, 512, 1, 1])
Flatten output shape: torch.Size([1, 512])
Linear output shape: torch.Size([1, 10])

訓(xùn)練模型

同之前一樣，我們在Fashion-MNIST數(shù)據(jù)集上訓(xùn)練ResNet。

lr, num_epochs, batch_size = 0.05, 10, 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, resize=96)
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

loss 0.014, train acc 0.996, test acc 0.895
4680.2 examples/sec on cuda:0

在這里插入圖片描述

以上就是Python深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)殘差塊的詳細(xì)內(nèi)容，更多關(guān)于Python神經(jīng)網(wǎng)絡(luò)的資料請關(guān)注腳本之家其它相關(guān)文章！

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

軟件下載

源碼下載

軟件編程

網(wǎng)絡(luò)編程

在線工具

數(shù)據(jù)庫

CMS

常用工具

Python深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)殘差塊

目錄

ResNet模型

訓(xùn)練模型

相關(guān)文章

最新評(píng)論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具