欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python深度學習神經(jīng)網(wǎng)絡殘差塊

 更新時間:2021年10月11日 11:04:35   作者:Supre_yuan  
這篇文章主要為大家介紹了Python深度學習中的神經(jīng)網(wǎng)絡殘差塊示例詳解有需要的 朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步

在這里插入圖片描述

在這里插入圖片描述

ResNet沿用VGG完整的KaTeX parse error: Undefined control sequence: \time at position 2: 3\̲t̲i̲m̲e̲3卷積層設計。殘差塊里首先有2個相同輸出通道數(shù)的KaTeX parse error: Undefined control sequence: \time at position 2: 3\̲t̲i̲m̲e̲3卷積層。每個卷積層后接一個批量歸一化層和ReLU激活函數(shù)。然后我們通過跨層數(shù)據(jù)通路,跳過這2個卷積運算,將輸入直接加在最后的ReLU激活函數(shù)前。這樣的設計要求2個卷積層的輸出與輸入形狀一樣,從而可以相加。如果想改變通道數(shù),就需要引入一個額外的 1 × 1 1\times1 1×1卷積層來講輸入變換成需要的形狀后再做相加運算。

殘差塊的實現(xiàn)如下:

import torch
from torch import nn
from torch.nn import functional as F
from d2l import torch as d2l

class Residual(nn.Module):
	def __init__(self, input_channels, num_channels, use_1x1conv=False, strides=1):
	super().__init__()
	self.conv1 = nn.Conv2d(input_channels, num_channels, kernel_size=3, padding=1, stride=strides)
	self.conv2 = nn.Conv2d(num_channels, num_channels, kernel_size=3, padding=1)

	if use_1x1conv:
		self.conv3 = nn.Conv2d(input_channels, num_channels, kernel_size=1, stride=strides)
	else:
		self.conv3 = None
	self.bn1 = nn.BatchNorm2d(num_channels)
	self.bn2 = nn.BatchNorm2d(num_channels)
	self.relu = nn.ReLU(inplace=True)

def forward(self, X):
	Y = F.relu(self.bn1(self.conv1(X)))
	Y = self.bn2(self.conv2(Y))
	if self.conv3:
		X = self.conv3(X)
	Y += X
	return F.relu(Y)	

如下圖所示,此外碼生成兩種類型的網(wǎng)絡:一種是在use_1x1conv=False、應用ReLU非線性函數(shù)之前,將輸入添加到輸出。另一種是在use_1x1conv=True時,添加通過 1 × 1 卷積調(diào)整通道和分辨率。

在這里插入圖片描述

下面我們來查看輸入和輸出形狀一致的情況。

blk = Residual(3, 3)
X = torch.rand(4, 3, 6, 6)
Y = blk(X)
Y.shape
torch.Size([4, 3, 6, 6])

我們也可以在增加輸出通道數(shù)的同時,減半輸出的高和寬。

blk = Residual(3, 6, use_1x1conv=True, strides=2)
blk(X).shape
torch.Size([4, 6, 3, 3])

ResNet模型

ResNet的前兩層為:在輸出通道數(shù)為64、步幅為2的 7 × 7 卷積層后,接步幅為2的 3 × 3 的最大匯聚層。不同之處在于ResNet的每個卷積層后增加了批量歸一化層。

b1 = nn.Sequential(nn.Conv2d(1, 64, kernel_size=7, stride=2, padding=3),
				   nn.BatchNorm2d(64), nn.ReLU(),
				   nn.MaxPool2d(kernel_size=3, stride=2, padding=1))

ResNet使用4個由殘差塊組成的模塊,每個模塊使用若干個同樣輸出通道數(shù)的殘差塊。第一個模塊的通道數(shù)同輸入通道數(shù)一致。由于之前已經(jīng)使用了步幅為2的最大匯聚層,所以無須減小高和寬。之后的每個模塊在第一個殘差塊里將上一個模塊的通道數(shù)翻倍,并將高和寬減半。

下面我們來實現(xiàn)這個模塊。注意,我們對第一個模塊做了特別處理。

def resnet_block(input_channels, num_channels, num_residuals, first_block=False):
	blk = []
	for i in range(num_residuals):
		if i == 0 and not first_block:
			blk.append(Residual(input_channels, num_channels, use_1x1conv=True, strides=2))
		else:
			blk.append(Residual(num_channels, num_channels))
	return blk

接著在ResNet加入所有殘差塊,這里每個模塊使用2個殘差塊。

b2 = nn.Sequential(*resnet_block(64, 64, 2, first_block=True))
b3 = nn.Sequential(*resnet_block(64, 128, 2))
b4 = nn.Sequential(*resnet_block(128, 256, 2))
b5 = nn.Sequential(*resnet_block(256, 512, 2))

最后,在ResNet中加入全局平均匯聚層,以及全連接層輸出。

net = nn.Sequential(b1, b2, b3, b4, b5,
					nn.AdaptiveAvgPool2d((1, 1)),
					nn.Flatten(), nn.Linear(512, 10))

每個模塊有4個卷積層(不包括恒等映射的 1 × 1 1\times1 1×1卷積層)。加上第一個 7 × 7 7\times7 7×7卷積層和最后一個全連接層,共有18層。因此,這種模型通常被稱為ResNet-18。通過配置不同的通道數(shù)和模塊里的殘差塊數(shù)可以得到不同的ResNet模型,例如更深的152層的ResNet-152。ResNet的結(jié)構(gòu)更簡單,修改也更方便。這些因素都導致了ResNet迅速被廣泛使用。下圖描述了完整的ResNet-18。

在這里插入圖片描述

在訓練ResNet之前,讓我們觀察一下ResNet中的不同模塊的輸入形狀是如何變化的。在之前的所有架構(gòu)中,分辨率降低,通道數(shù)量增加,直到全局平均匯聚層聚集所有特征。

X = torch.rand(size=(1, 1, 224, 224))
for layer in net:
	X = layer(X)
	print(layer.__class__.__name__,'output shape:\t', X.shape)
Sequential output shape: torch.Size([1, 64, 56, 56])
Sequential output shape: torch.Size([1, 64, 56, 56])
Sequential output shape: torch.Size([1, 128, 28, 28])
Sequential output shape: torch.Size([1, 256, 14, 14])
Sequential output shape: torch.Size([1, 512, 7, 7])
AdaptiveAvgPool2d output shape: torch.Size([1, 512, 1, 1])
Flatten output shape: torch.Size([1, 512])
Linear output shape: torch.Size([1, 10])

訓練模型

同之前一樣,我們在Fashion-MNIST數(shù)據(jù)集上訓練ResNet。

lr, num_epochs, batch_size = 0.05, 10, 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, resize=96)
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())
loss 0.014, train acc 0.996, test acc 0.895
4680.2 examples/sec on cuda:0

在這里插入圖片描述

以上就是Python深度學習神經(jīng)網(wǎng)絡殘差塊的詳細內(nèi)容,更多關于Python神經(jīng)網(wǎng)絡的資料請關注腳本之家其它相關文章!

相關文章

最新評論