人工智能學習pyTorch的ResNet殘差模塊示例詳解
1.定義ResNet殘差模塊
一個block中,有兩個卷積層,之后的輸出還要和輸入進行相加。因此一個block的前向流程如下:
輸入x→卷積層→數(shù)據(jù)標準化→ReLU→卷積層→數(shù)據(jù)標準化→數(shù)據(jù)和x相加→ReLU→輸出out
中間加上了數(shù)據(jù)的標準化(通過nn.BatchNorm2d實現(xiàn)),可以使得效果更好一些。
①各層的定義
②前向傳播
在前向傳播中輸入x,過程中根據(jù)前向流程,調(diào)用上面定義的層即可。
如此,便定義好了一個殘差的模塊。
2.ResNet18的實現(xiàn)
此處的ResNet18并沒有涉及到太多細節(jié),只是一個大致的內(nèi)容。
在初始化的時候,定義好所需要使用的模塊,根據(jù)上面定義好的殘差模塊,調(diào)用即可。在這里使用了4次殘差模塊,將通道數(shù)從輸入的3(也就是RGB),變成了512通道。也就是最終提取的高級特征。提取完特征,直接輸入給Linear方法,得到圖片在10種圖片類型上的結果,用于預測以及損失值的求解。
①各層的定義
②前向傳播
同樣的,調(diào)用上面定義好的層,根據(jù)流程傳播即可。
3.測試ResNet18
如下圖,輸入的是2張圖,RGB,長寬均是32的數(shù)據(jù)。
通過ResNet18之后,輸出的是2張圖,每張圖對應10種類型的不同取值logits。
過程中的通道數(shù)目的轉換如下面的結果所示:3→64→128→256→512→512
過程中的尺寸轉換,根據(jù)設置的卷積核,以及步長,會有不同的結果。但總體都是為了得到更高級的特征,最終輸入全連層,得到Logits。
以上就是人工智能學習pyTorch的ResNet殘差模塊示例詳解的詳細內(nèi)容,更多關于PyTorch人工智能學習ResNet殘差模塊的資料請關注腳本之家其它相關文章!
相關文章
opencv python 對指針儀表讀數(shù)識別的兩種方式
這篇文章主要介紹了opencv python 對指針儀表讀數(shù)識別的兩種方式,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-01-01python網(wǎng)絡爬蟲之模擬登錄 自動獲取cookie值 驗證碼識別的具體實現(xiàn)
有時,我們需要爬取一些基于個人用戶的用戶信息(需要登陸后才可以查看)就要進行模擬登陸,因為驗證碼往往是作為登陸請求中的請求參數(shù)被使用,就需要識別驗證碼2021-09-09基于python3 OpenCV3實現(xiàn)靜態(tài)圖片人臉識別
這篇文章主要為大家詳細介紹了基于Python3 OpenCV3實現(xiàn)靜態(tài)圖片人臉識別,具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-05-05Python常用數(shù)據(jù)庫接口sqlite3和MySQLdb學習指南
在本章節(jié)中,我們將學習 Python 中常用的數(shù)據(jù)庫接口,包括 sqlite3用于SQLite數(shù)據(jù)庫和MySQLdb用于 MySQL 數(shù)據(jù)庫,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2023-06-06