ConvNeXt實戰(zhàn)之實現(xiàn)植物幼苗分類

更新時間：2022年01月17日 10:52:31 作者：AI浩

ConvNeXts由標準ConvNet模塊構建，在準確性和可擴展性方面與 Transformer競爭，實現(xiàn)87.8% ImageNet top-1 準確率，在 COCO 檢測和 ADE20K 分割方面優(yōu)于 Swin Transformers。本文將利用ConvNeXt實現(xiàn)植物幼苗分類，需要的可以參考一下

前言

ConvNeXts 完全由標準 ConvNet 模塊構建，在準確性和可擴展性方面與 Transformer 競爭，實現(xiàn) 87.8% ImageNet top-1 準確率，在 COCO 檢測和 ADE20K 分割方面優(yōu)于 Swin Transformers，同時保持標準 ConvNet 的簡單性和效率。

論文鏈接：https://arxiv.org/pdf/2201.03545.pdf

代碼鏈接：https://github.com/facebookresearch/ConvNeXt

如果github不能下載，可以使用下面的連接：

https://gitcode.net/hhhhhhhhhhwwwwwwwwww/ConvNeXt

ConvNexts的特點;

使用7×7的卷積核，在VGG、ResNet等經(jīng)典的CNN模型中，使用的是小卷積核，但是ConvNexts證明了大卷積和的有效性。作者嘗試了幾種內(nèi)核大小，包括 3、5、7、9 和 11。網(wǎng)絡的性能從 79.9% (3×3) 提高到 80.6% (7×7)，而網(wǎng)絡的 FLOPs 大致保持不變，內(nèi)核大小的好處在 7×7 處達到飽和點。

使用GELU（高斯誤差線性單元）激活函數(shù)。GELUs是 dropout、zoneout、Relus的綜合，GELUs對于輸入乘以一個0,1組成的mask，而該mask的生成則是依概率隨機的依賴于輸入。實驗效果要比Relus與ELUs都要好。下圖是實驗數(shù)據(jù):

使用LayerNorm而不是BatchNorm。

倒置瓶頸。圖 3 (a) 至 (b) 說明了這些配置。盡管深度卷積層的 FLOPs 增加了，但由于下采樣殘差塊的快捷 1×1 卷積層的 FLOPs 顯著減少，這種變化將整個網(wǎng)絡的 FLOPs 減少到 4.6G。成績從 80.5% 提高到 80.6%。在 ResNet-200/Swin-B 方案中，這一步帶來了更多的收益（81.9% 到 82.6%），同時也減少了 FLOP。

ConvNeXt殘差模塊

殘差模塊是整個模型的核心。如下圖：

代碼實現(xiàn)：

class Block(nn.Module):
    r""" ConvNeXt Block. There are two equivalent implementations:
    (1) DwConv -> LayerNorm (channels_first) -> 1x1 Conv -> GELU -> 1x1 Conv; all in (N, C, H, W)
    (2) DwConv -> Permute to (N, H, W, C); LayerNorm (channels_last) -> Linear -> GELU -> Linear; Permute back
    We use (2) as we find it slightly faster in PyTorch
    
    Args:
        dim (int): Number of input channels.
        drop_path (float): Stochastic depth rate. Default: 0.0
        layer_scale_init_value (float): Init value for Layer Scale. Default: 1e-6.
    """
    def __init__(self, dim, drop_path=0., layer_scale_init_value=1e-6):
        super().__init__()
        self.dwconv = nn.Conv2d(dim, dim, kernel_size=7, padding=3, groups=dim) # depthwise conv
        self.norm = LayerNorm(dim, eps=1e-6)
        self.pwconv1 = nn.Linear(dim, 4 * dim) # pointwise/1x1 convs, implemented with linear layers
        self.act = nn.GELU()
        self.pwconv2 = nn.Linear(4 * dim, dim)
        self.gamma = nn.Parameter(layer_scale_init_value * torch.ones((dim)), 
                                    requires_grad=True) if layer_scale_init_value > 0 else None
        self.drop_path = DropPath(drop_path) if drop_path > 0. else nn.Identity()
    def forward(self, x):
        input = x
        x = self.dwconv(x)
        x = x.permute(0, 2, 3, 1) # (N, C, H, W) -> (N, H, W, C)
        x = self.norm(x)
        x = self.pwconv1(x)
        x = self.act(x)
        x = self.pwconv2(x)
        if self.gamma is not None:
            x = self.gamma * x
        x = x.permute(0, 3, 1, 2) # (N, H, W, C) -> (N, C, H, W)
        x = input + self.drop_path(x)
        return x

數(shù)據(jù)增強Cutout和Mixup

ConvNext使用了Cutout和Mixup，為了提高成績我在我的代碼中也加入這兩種增強方式。官方使用timm，我沒有采用官方的，而選擇用torchtoolbox。安裝命令：

pip install torchtoolbox

Cutout實現(xiàn)，在transforms中。

from torchtoolbox.transform import Cutout

# 數(shù)據(jù)預處理

transform = transforms.Compose([
? ? transforms.Resize((224, 224)),
? ? Cutout(),
? ? transforms.ToTensor(),
? ? transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])

])

Mixup實現(xiàn)，在train方法中。需要導入包：from torchtoolbox.tools import mixup_data, mixup_criterion

    for batch_idx, (data, target) in enumerate(train_loader):
        data, target = data.to(device, non_blocking=True), target.to(device, non_blocking=True)
        data, labels_a, labels_b, lam = mixup_data(data, target, alpha)
        optimizer.zero_grad()
        output = model(data)
        loss = mixup_criterion(criterion, output, labels_a, labels_b, lam)
        loss.backward()
        optimizer.step()
        print_loss = loss.data.item()

項目結構

使用tree命令，打印項目結構

數(shù)據(jù)集

數(shù)據(jù)集選用植物幼苗分類，總共12類。數(shù)據(jù)集連接如下：

鏈接提取碼：syng

在工程的根目錄新建data文件夾，獲取數(shù)據(jù)集后，將trian和test解壓放到data文件夾下面，如下圖：

導入模型文件

從官方的鏈接中找到convnext.py文件，將其放入Model文件夾中。如圖：

安裝庫，并導入需要的庫

模型用到了timm庫，如果沒有需要安裝，執(zhí)行命令：

pip install timm

新建train_connext.py文件，導入所需要的包：

import torch.optim as optim
import torch
import torch.nn as nn
import torch.nn.parallel
import torch.utils.data
import torch.utils.data.distributed
import torchvision.transforms as transforms
from dataset.dataset import SeedlingData
from torch.autograd import Variable
from Model.convnext import convnext_tiny
from torchtoolbox.tools import mixup_data, mixup_criterion
from torchtoolbox.transform import Cutout

設置全局參數(shù)

設置使用GPU，設置學習率、BatchSize、epoch等參數(shù)。

# 設置全局參數(shù)
modellr = 1e-4
BATCH_SIZE = 8
EPOCHS = 300
DEVICE = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

數(shù)據(jù)預處理

數(shù)據(jù)處理比較簡單，沒有做復雜的嘗試，有興趣的可以加入一些處理。

# 數(shù)據(jù)預處理

transform = transforms.Compose([
? ? transforms.Resize((224, 224)),
? ? Cutout(),
? ? transforms.ToTensor(),
? ? transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])

])
transform_test = transforms.Compose([
? ? transforms.Resize((224, 224)),
? ? transforms.ToTensor(),
? ? transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
])

數(shù)據(jù)讀取

然后我們在dataset文件夾下面新建 init.py和dataset.py，在mydatasets.py文件夾寫入下面的代碼：

說一下代碼的核心邏輯。

第一步建立字典，定義類別對應的ID,用數(shù)字代替類別。

第二步在__init__里面編寫獲取圖片路徑的方法。測試集只有一層路徑直接讀取，訓練集在train文件夾下面是類別文件夾，先獲取到類別，再獲取到具體的圖片路徑。然后使用sklearn中切分數(shù)據(jù)集的方法，按照7：3的比例切分訓練集和驗證集。

第三步在__getitem__方法中定義讀取單個圖片和類別的方法，由于圖像中有位深度32位的，所以我在讀取圖像的時候做了轉(zhuǎn)換。

代碼如下：

# coding:utf8
import os
from PIL import Image
from torch.utils import data
from torchvision import transforms as T
from sklearn.model_selection import train_test_split

Labels = {'Black-grass': 0, 'Charlock': 1, 'Cleavers': 2, 'Common Chickweed': 3,
? ? ? ? ? 'Common wheat': 4, 'Fat Hen': 5, 'Loose Silky-bent': 6, 'Maize': 7, 'Scentless Mayweed': 8,
? ? ? ? ? 'Shepherds Purse': 9, 'Small-flowered Cranesbill': 10, 'Sugar beet': 11}


class SeedlingData(data.Dataset):

? ? def __init__(self, root, transforms=None, train=True, test=False):
? ? ? ? """
? ? ? ? 主要目標： 獲取所有圖片的地址，并根據(jù)訓練，驗證，測試劃分數(shù)據(jù)
? ? ? ? """
? ? ? ? self.test = test
? ? ? ? self.transforms = transforms

? ? ? ? if self.test:
? ? ? ? ? ? imgs = [os.path.join(root, img) for img in os.listdir(root)]
? ? ? ? ? ? self.imgs = imgs
? ? ? ? else:
? ? ? ? ? ? imgs_labels = [os.path.join(root, img) for img in os.listdir(root)]
? ? ? ? ? ? imgs = []
? ? ? ? ? ? for imglable in imgs_labels:
? ? ? ? ? ? ? ? for imgname in os.listdir(imglable):
? ? ? ? ? ? ? ? ? ? imgpath = os.path.join(imglable, imgname)
? ? ? ? ? ? ? ? ? ? imgs.append(imgpath)
? ? ? ? ? ? trainval_files, val_files = train_test_split(imgs, test_size=0.3, random_state=42)
? ? ? ? ? ? if train:
? ? ? ? ? ? ? ? self.imgs = trainval_files
? ? ? ? ? ? else:
? ? ? ? ? ? ? ? self.imgs = val_files

? ? def __getitem__(self, index):
? ? ? ? """
? ? ? ? 一次返回一張圖片的數(shù)據(jù)
? ? ? ? """
? ? ? ? img_path = self.imgs[index]
? ? ? ? img_path = img_path.replace("\\", '/')
? ? ? ? if self.test:
? ? ? ? ? ? label = -1
? ? ? ? else:
? ? ? ? ? ? labelname = img_path.split('/')[-2]
? ? ? ? ? ? label = Labels[labelname]
? ? ? ? data = Image.open(img_path).convert('RGB')
? ? ? ? data = self.transforms(data)
? ? ? ? return data, label

? ? def __len__(self):
? ? ? ? return len(self.imgs)

然后我們在train.py調(diào)用SeedlingData讀取數(shù)據(jù) ，記著導入剛才寫的dataset.py(from mydatasets import SeedlingData)

# 讀取數(shù)據(jù)
dataset_train = SeedlingData('data/train', transforms=transform, train=True)
dataset_test = SeedlingData("data/train", transforms=transform_test, train=False)
# 導入數(shù)據(jù)
train_loader = torch.utils.data.DataLoader(dataset_train, batch_size=BATCH_SIZE, shuffle=True)
test_loader = torch.utils.data.DataLoader(dataset_test, batch_size=BATCH_SIZE, shuffle=False)

設置模型

設置loss函數(shù)為nn.CrossEntropyLoss()。

設置模型為coatnet_0，修改最后一層全連接輸出改為12（數(shù)據(jù)集的類別）。
優(yōu)化器設置為adam。
學習率調(diào)整策略改為余弦退火

# 實例化模型并且移動到GPU
criterion = nn.CrossEntropyLoss()
#criterion = SoftTargetCrossEntropy()
model_ft = convnext_tiny(pretrained=True)
num_ftrs = model_ft.head.in_features
model_ft.fc = nn.Linear(num_ftrs, 12)
model_ft.to(DEVICE)
# 選擇簡單暴力的Adam優(yōu)化器，學習率調(diào)低
optimizer = optim.Adam(model_ft.parameters(), lr=modellr)
cosine_schedule = optim.lr_scheduler.CosineAnnealingLR(optimizer=optimizer,T_max=20,eta_min=1e-9)

定義訓練和驗證函數(shù)

alpha=0.2 Mixup所需的參數(shù)。

# 定義訓練過程
alpha=0.2
def train(model, device, train_loader, optimizer, epoch):
? ? model.train()
? ? sum_loss = 0
? ? total_num = len(train_loader.dataset)
? ? print(total_num, len(train_loader))
? ? for batch_idx, (data, target) in enumerate(train_loader):
? ? ? ? data, target = data.to(device, non_blocking=True), target.to(device, non_blocking=True)
? ? ? ? data, labels_a, labels_b, lam = mixup_data(data, target, alpha)
? ? ? ? optimizer.zero_grad()
? ? ? ? output = model(data)
? ? ? ? loss = mixup_criterion(criterion, output, labels_a, labels_b, lam)
? ? ? ? loss.backward()
? ? ? ? optimizer.step()
? ? ? ? print_loss = loss.data.item()
? ? ? ? sum_loss += print_loss
? ? ? ? if (batch_idx + 1) % 10 == 0:
? ? ? ? ? ? print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(
? ? ? ? ? ? ? ? epoch, (batch_idx + 1) * len(data), len(train_loader.dataset),
? ? ? ? ? ? ? ? ? ? ? ?100. * (batch_idx + 1) / len(train_loader), loss.item()))
? ? ave_loss = sum_loss / len(train_loader)
? ? print('epoch:{},loss:{}'.format(epoch, ave_loss))

ACC=0
# 驗證過程
def val(model, device, test_loader):
? ? global ACC
? ? model.eval()
? ? test_loss = 0
? ? correct = 0
? ? total_num = len(test_loader.dataset)
? ? print(total_num, len(test_loader))
? ? with torch.no_grad():
? ? ? ? for data, target in test_loader:
? ? ? ? ? ? data, target = Variable(data).to(device), Variable(target).to(device)
? ? ? ? ? ? output = model(data)
? ? ? ? ? ? loss = criterion(output, target)
? ? ? ? ? ? _, pred = torch.max(output.data, 1)
? ? ? ? ? ? correct += torch.sum(pred == target)
? ? ? ? ? ? print_loss = loss.data.item()
? ? ? ? ? ? test_loss += print_loss
? ? ? ? correct = correct.data.item()
? ? ? ? acc = correct / total_num
? ? ? ? avgloss = test_loss / len(test_loader)
? ? ? ? print('\nVal set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(
? ? ? ? ? ? avgloss, correct, len(test_loader.dataset), 100 * acc))
? ? ? ? if acc > ACC:
? ? ? ? ? ? torch.save(model_ft, 'model_' + str(epoch) + '_' + str(round(acc, 3)) + '.pth')
? ? ? ? ? ? ACC = acc


# 訓練

for epoch in range(1, EPOCHS + 1):
? ? train(model_ft, DEVICE, train_loader, optimizer, epoch)
? ? cosine_schedule.step()
? ? val(model_ft, DEVICE, test_loader)

然后就可以開始訓練了

訓練10個epoch就能得到不錯的結果：

測試

第一種寫法

測試集存放的目錄如下圖：

第一步定義類別，這個類別的順序和訓練時的類別順序?qū)欢ú灰淖冺樞颍。。。?/p>

classes = ('Black-grass', 'Charlock', 'Cleavers', 'Common Chickweed',
           'Common wheat', 'Fat Hen', 'Loose Silky-bent',
           'Maize', 'Scentless Mayweed', 'Shepherds Purse', 'Small-flowered Cranesbill', 'Sugar beet')

第二步定義transforms，transforms和驗證集的transforms一樣即可，別做數(shù)據(jù)增強。

transform_test = transforms.Compose([
         transforms.Resize((224, 224)),
        transforms.ToTensor(),
        transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
])

第三步加載model，并將模型放在DEVICE里。

DEVICE = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
model = torch.load("model_8_0.971.pth")
model.eval()
model.to(DEVICE)

第四步讀取圖片并預測圖片的類別，在這里注意，讀取圖片用PIL庫的Image。不要用cv2，transforms不支持。

path = 'data/test/'
testList = os.listdir(path)
for file in testList:
    img = Image.open(path + file)
    img = transform_test(img)
    img.unsqueeze_(0)
    img = Variable(img).to(DEVICE)
    out = model(img)
    # Predict
    _, pred = torch.max(out.data, 1)
    print('Image Name:{},predict:{}'.format(file, classes[pred.data.item()]))

測試完整代碼：

import torch.utils.data.distributed
import torchvision.transforms as transforms
from PIL import Image
from torch.autograd import Variable
import os

classes = ('Black-grass', 'Charlock', 'Cleavers', 'Common Chickweed',
? ? ? ? ? ?'Common wheat', 'Fat Hen', 'Loose Silky-bent',
? ? ? ? ? ?'Maize', 'Scentless Mayweed', 'Shepherds Purse', 'Small-flowered Cranesbill', 'Sugar beet')
transform_test = transforms.Compose([
? ? transforms.Resize((224, 224)),
? ? transforms.ToTensor(),
? ? transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
])

DEVICE = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
model = torch.load("model_8_0.971.pth")
model.eval()
model.to(DEVICE)

path = 'data/test/'
testList = os.listdir(path)
for file in testList:
? ? img = Image.open(path + file)
? ? img = transform_test(img)
? ? img.unsqueeze_(0)
? ? img = Variable(img).to(DEVICE)
? ? out = model(img)
? ? # Predict
? ? _, pred = torch.max(out.data, 1)
? ? print('Image Name:{},predict:{}'.format(file, classes[pred.data.item()]))

運行結果：

第二種寫法

第二種，使用自定義的Dataset讀取圖片。前三步同上，差別主要在第四步。讀取數(shù)據(jù)的時候，使用Dataset的SeedlingData讀取。

dataset_test =SeedlingData('data/test/', transform_test,test=True)
print(len(dataset_test))
# 對應文件夾的label
 
for index in range(len(dataset_test)):
    item = dataset_test[index]
    img, label = item
    img.unsqueeze_(0)
    data = Variable(img).to(DEVICE)
    output = model(data)
    _, pred = torch.max(output.data, 1)
    print('Image Name:{},predict:{}'.format(dataset_test.imgs[index], classes[pred.data.item()]))
    index += 1

運行結果：

以上就是ConvNeXt實戰(zhàn)之實現(xiàn)植物幼苗分類的詳細內(nèi)容，更多關于ConvNeXt植物幼苗分類的資料請關注腳本之家其它相關文章！

您可能感興趣的文章:

Python基礎知識方法重寫+文件處理+異常處理
這篇文章主要介紹了Python基礎知識方法重寫+文件處理+異常處理，這是基礎知識分享的第四篇，看到這里了相信大家前幾篇都學得還不錯吧，下面我們繼續(xù)鞏固Python基礎知識,需要的朋友也可以參考一下
2022-05-05
python3中替換python2中cmp函數(shù)的實現(xiàn)
這篇文章主要介紹了python3替換python2中cmp函數(shù)，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2019-08-08
python 正則式概述及常用字符
python 正則，剛開始需要注意的他的正則的獨特的地方。不同語言的正則稍有不同。
2009-05-05
淺談keras中的Merge層(實現(xiàn)層的相加、相減、相乘實例)
這篇文章主要介紹了淺談keras中的Merge層(實現(xiàn)層的相加、相減、相乘實例)，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-05-05
python中py文件與pyc文件相互轉(zhuǎn)換的方法實例
pyc是一種二進制文件,是由py文件經(jīng)過編譯后,生成的文件,下面這篇文章主要給大家介紹了關于python中py文件與pyc文件相互轉(zhuǎn)換的相關資料,需要的朋友可以參考下
2022-05-05
python執(zhí)行shell腳本的四種方法
在Python中提供了很多的方法可以調(diào)用并執(zhí)行shell腳本，本文主要介紹了python執(zhí)行shell腳本的四種方法，文中通過示例代碼介紹的非常詳細，需要的朋友們下面隨著小編來一起學習學習吧
2023-06-06
Python實現(xiàn)學生成績管理系統(tǒng)
這篇文章主要為大家詳細介紹了Python實現(xiàn)學生成績管理系統(tǒng)，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2018-01-01
Python繪制雷達圖時遇到的坑的解決
這篇文章主要介紹了Python繪制雷達圖時遇到的坑的解決，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2021-04-04
詳解Python如何實現(xiàn)壓縮與解壓縮數(shù)據(jù)
當數(shù)據(jù)量大的時候,自然而然想到的就是對數(shù)據(jù)進行壓縮,這篇文章主要為大家介紹了Python可以實現(xiàn)壓縮與解壓縮數(shù)據(jù)的相關模塊的使用,希望對大家有所幫助
2024-02-02
Python使用xlwt模塊操作Excel的方法詳解
這篇文章主要介紹了Python使用xlwt模塊操作Excel的方法,結合實例形式分析了Python安裝xlwt模塊及使用xlwt模塊針對Excel文件的創(chuàng)建、設置、保存等常用操作技巧,需要的朋友可以參考下
2018-03-03

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

軟件下載

源碼下載

軟件編程

網(wǎng)絡編程

在線工具

數(shù)據(jù)庫

CMS

常用工具

ConvNeXt實戰(zhàn)之實現(xiàn)植物幼苗分類

目錄

前言

ConvNeXt殘差模塊

數(shù)據(jù)增強Cutout和Mixup

項目結構

數(shù)據(jù)集

導入模型文件

安裝庫，并導入需要的庫

設置全局參數(shù)

數(shù)據(jù)預處理

設置模型

定義訓練和驗證函數(shù)

測試

第一種寫法

第二種寫法

相關文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

ConvNeXt實戰(zhàn)之實現(xiàn)植物幼苗分類

目錄

前言

ConvNeXt殘差模塊

數(shù)據(jù)增強Cutout和Mixup

項目結構

數(shù)據(jù)集

導入模型文件

安裝庫，并導入需要的庫

設置全局參數(shù)

數(shù)據(jù)預處理

設置模型

定義訓練和驗證函數(shù)

測試

第一種寫法

第二種寫法

相關文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

安裝庫，并導入需要的庫