pytorch 中transforms的使用詳解
transforms
按住Ctrl查看transforms的源碼可以知道,transforms就是一個(gè)python文件,里面定義了很多類(lèi),每一個(gè)類(lèi)都是一個(gè)工具
在結(jié)構(gòu)那里,可以看到有很多的類(lèi)
ToTensor
Convert a
PIL Image
ornumpy.ndarray
to tensor. This transform does not support torchscript
通過(guò)ToTensor來(lái)學(xué)習(xí)transforms如何使用以及為什么使用tensor數(shù)據(jù)類(lèi)型
transforms使用
transforms里面每一個(gè)類(lèi)都可以看成是一個(gè)模具,我們可以用里面的模具做出一個(gè)具體的工具,如何用這個(gè)具體的工具來(lái)實(shí)現(xiàn)具體的功能
比如ToTensor的使用:
from torchvision import transforms from PIL import Image img_path = "data/train/ants_image/0013035.jpg" img = Image.open(img_path) tensor_trans = transforms.ToTensor()#模具(也就是這個(gè)類(lèi)的對(duì)象) tensor_img = tensor_trans(img)#實(shí)現(xiàn)ToTensor的功能,將一個(gè)input(PIL Image)轉(zhuǎn)化成tensor print(tensor_img)
為什么需要tensor數(shù)據(jù)類(lèi)型呢?
在使用tensorboard里面常用的add_image時(shí),里面的第二個(gè)參數(shù)是圖片的數(shù)據(jù)類(lèi)型,這個(gè)數(shù)據(jù)類(lèi)型,可以是torch.Tensor, numpy.array, or string/blobname,上一篇博客用的是numpy.array,這里,其實(shí)可以直接得到tensor類(lèi)型后直接用
from torchvision import transforms from torch.utils.tensorboard import SummaryWriter from PIL import Image img_path = "data/train/ants_image/0013035.jpg" img = Image.open(img_path) tensor_trans = transforms.ToTensor() tensor_img = tensor_trans(img) writer = SummaryWriter("logs") writer.add_image("Tensor_image", tensor_img) writer.close()
常見(jiàn)的transforms
內(nèi)置方法__call__()
可以發(fā)現(xiàn)基本上transforms里面的每一個(gè)類(lèi)都有一個(gè)內(nèi)置方法__call__(),這個(gè)方法和普通的方法的區(qū)別其實(shí)就是,普通方法一般是類(lèi)的對(duì)象通過(guò).
的方式調(diào)用,但是call函數(shù)不需要,可以直接用對(duì)象加括號(hào)的形式調(diào)用
一個(gè)Person類(lèi),內(nèi)置方法__call__和hello都有一個(gè)參數(shù)name,然后兩個(gè)方法都輸出name,一個(gè)通過(guò)person(“”)形式調(diào)用,一個(gè)通過(guò)person.hello(“”)調(diào)用
Normalize
Normalize a tensor image with mean and standard deviation.
這個(gè)方法進(jìn)行歸一化的時(shí)候,傳入的參數(shù)是有兩個(gè)列表一個(gè)是均值,一個(gè)是標(biāo)準(zhǔn)差,每個(gè)列表的n表示維度,是根據(jù)輸入的channel數(shù)量決定的,比如我們的圖片是rgb那n=3,它能將每個(gè)信道的輸入進(jìn)行歸一化
根據(jù)公式可以知道計(jì)算的結(jié)果其實(shí)就是
代碼示例:
from PIL import Image from torchvision import transforms img_path = "data/train/ants_image/0013035.jpg" img = Image.open(img_path) trans_totensor = transforms.ToTensor() img_tensor = trans_totensor(img) print(img_tensor[0][0][0]) trans_norm = transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5]) img_norm = trans_norm(img_tensor) print(img_norm[0][0][0]) writer = SummaryWriter("logs") writer.add_image("Normalize", img_norm) writer.close()
輸出:
tensor(0.3137)
tensor(-0.3725)
Resize
Resize the input image to the given size
參數(shù):
可以給一個(gè)(H,W)這樣的參數(shù),改變圖片的大小,也可以指定一個(gè)int,改變長(zhǎng)和寬的比例
代碼示例
print(img.size) trans_resize = transforms.Resize((512, 512)) img_resize = trans_resize(img)# 參數(shù)和返回值都是 img PIL print(img_resize)
輸出結(jié)果:
變成了正方形
Compose
Composes several transforms together. This transform does not support torchscript.
可以將第一種類(lèi)型轉(zhuǎn)化為第二種,參數(shù)一的類(lèi)型做輸入,參數(shù)二的類(lèi)型做輸出,輸入一定要對(duì)應(yīng),不然就會(huì)報(bào)錯(cuò)
代碼示例
trans_totensor = transforms.ToTensor() trans_resize_2 = transforms.Resize(512) # PIL -> tensor trans_compose = transforms.Compose([trans_resize_2, trans_totensor]) img_resize_2 = trans_compose(img) writer.add_image("Resize", img_resize_2, 1)
到此這篇關(guān)于pytroch中transforms的使用詳解的文章就介紹到這了,更多相關(guān)pytroch transforms的使用內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
學(xué)會(huì)這個(gè)炫酷圖表利器pyecharts,還怕不被公司重用?
前段時(shí)間,公司高層要看上半年度項(xiàng)目組業(yè)績(jī)數(shù)據(jù)分析,沒(méi)辦法,硬著頭皮也要上!說(shuō)到數(shù)據(jù)分析,肯定離不開(kāi)數(shù)據(jù)的可視化,畢竟圖表比冷冰冰的數(shù)字更加直觀(guān),Boss只想一眼就能看出趨勢(shì)和結(jié)論.今天我們就聊一聊 pyecharts 中幾種常用的圖表, ,需要的朋友可以參考下2021-06-06python連接讀寫(xiě)操作redis的完整代碼實(shí)例
這篇文章主要介紹了python連接讀寫(xiě)操作redis的完整代碼實(shí)例,包括redis連接與讀寫(xiě)操作,redis-sentinel哨兵模式下Python操作redis,redis-cluster(集群)模式下Python操作redis,需要的朋友可以參考下2023-01-01python使用matplotlib:subplot繪制多個(gè)子圖的示例
這篇文章主要介紹了python使用matplotlib:subplot繪制多個(gè)子圖的示例,幫助大家更好的利用python繪制圖像,感興趣的朋友可以了解下2020-09-09基于python進(jìn)行桶排序與基數(shù)排序的總結(jié)
今天小編就為大家分享一篇基于python進(jìn)行桶排序與基數(shù)排序的總結(jié),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-05-05python通過(guò)opencv調(diào)用攝像頭操作實(shí)例分析
在本篇文章里小編給大家整理的是一篇關(guān)于python通過(guò)opencv調(diào)用攝像頭操作實(shí)例分析內(nèi)容,有興趣的朋友們可以學(xué)習(xí)下。2021-06-06在Pandas中導(dǎo)入CSV數(shù)據(jù)時(shí)去除默認(rèn)索引的方法匯總
在Pandas中讀取CSV數(shù)據(jù)時(shí),會(huì)默認(rèn)將第一列設(shè)為索引列index,但有時(shí)候我們并不需要索引,或者希望指定自己的索引列,本文將介紹幾種在Pandas中導(dǎo)入CSV數(shù)據(jù)時(shí)去除默認(rèn)索引的方法,需要的朋友可以參考下2023-05-05PyQt5的相對(duì)布局管理的實(shí)現(xiàn)
這篇文章主要介紹了PyQt5的相對(duì)布局管理的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-08-08Python網(wǎng)絡(luò)安全格式字符串漏洞任意地址覆蓋大數(shù)字詳解
這篇文章主要介紹了Python網(wǎng)絡(luò)安全格式字符串漏洞任意地址覆蓋大數(shù)字的示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步2021-10-10用Python實(shí)現(xiàn)將一張圖片分成9宮格的示例
今天小編就為大家分享一篇用Python實(shí)現(xiàn)將一張圖片分成9宮格的示例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-07-07python爬蟲(chóng)請(qǐng)求頭設(shè)置代碼
在本篇文章里小編給大家整理的是一篇關(guān)于python爬蟲(chóng)請(qǐng)求頭如何設(shè)置內(nèi)容,需要的朋友們可以學(xué)習(xí)下。2020-07-07