pytorch 中transforms的使用詳解
transforms
按住Ctrl查看transforms的源碼可以知道,transforms就是一個python文件,里面定義了很多類,每一個類都是一個工具
在結構那里,可以看到有很多的類
ToTensor
Convert a
PIL Image
ornumpy.ndarray
to tensor. This transform does not support torchscript
通過ToTensor來學習transforms如何使用以及為什么使用tensor數(shù)據(jù)類型
transforms使用
transforms里面每一個類都可以看成是一個模具,我們可以用里面的模具做出一個具體的工具,如何用這個具體的工具來實現(xiàn)具體的功能
比如ToTensor的使用:
from torchvision import transforms from PIL import Image img_path = "data/train/ants_image/0013035.jpg" img = Image.open(img_path) tensor_trans = transforms.ToTensor()#模具(也就是這個類的對象) tensor_img = tensor_trans(img)#實現(xiàn)ToTensor的功能,將一個input(PIL Image)轉(zhuǎn)化成tensor print(tensor_img)
為什么需要tensor數(shù)據(jù)類型呢?
在使用tensorboard里面常用的add_image時,里面的第二個參數(shù)是圖片的數(shù)據(jù)類型,這個數(shù)據(jù)類型,可以是torch.Tensor, numpy.array, or string/blobname,上一篇博客用的是numpy.array,這里,其實可以直接得到tensor類型后直接用
from torchvision import transforms from torch.utils.tensorboard import SummaryWriter from PIL import Image img_path = "data/train/ants_image/0013035.jpg" img = Image.open(img_path) tensor_trans = transforms.ToTensor() tensor_img = tensor_trans(img) writer = SummaryWriter("logs") writer.add_image("Tensor_image", tensor_img) writer.close()
常見的transforms
內(nèi)置方法__call__()
可以發(fā)現(xiàn)基本上transforms里面的每一個類都有一個內(nèi)置方法__call__(),這個方法和普通的方法的區(qū)別其實就是,普通方法一般是類的對象通過.
的方式調(diào)用,但是call函數(shù)不需要,可以直接用對象加括號的形式調(diào)用
一個Person類,內(nèi)置方法__call__和hello都有一個參數(shù)name,然后兩個方法都輸出name,一個通過person(“”)形式調(diào)用,一個通過person.hello(“”)調(diào)用
Normalize
Normalize a tensor image with mean and standard deviation.
這個方法進行歸一化的時候,傳入的參數(shù)是有兩個列表一個是均值,一個是標準差,每個列表的n表示維度,是根據(jù)輸入的channel數(shù)量決定的,比如我們的圖片是rgb那n=3,它能將每個信道的輸入進行歸一化
根據(jù)公式可以知道計算的結果其實就是
代碼示例:
from PIL import Image from torchvision import transforms img_path = "data/train/ants_image/0013035.jpg" img = Image.open(img_path) trans_totensor = transforms.ToTensor() img_tensor = trans_totensor(img) print(img_tensor[0][0][0]) trans_norm = transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5]) img_norm = trans_norm(img_tensor) print(img_norm[0][0][0]) writer = SummaryWriter("logs") writer.add_image("Normalize", img_norm) writer.close()
輸出:
tensor(0.3137)
tensor(-0.3725)
Resize
Resize the input image to the given size
參數(shù):
可以給一個(H,W)這樣的參數(shù),改變圖片的大小,也可以指定一個int,改變長和寬的比例
代碼示例
print(img.size) trans_resize = transforms.Resize((512, 512)) img_resize = trans_resize(img)# 參數(shù)和返回值都是 img PIL print(img_resize)
輸出結果:
變成了正方形
Compose
Composes several transforms together. This transform does not support torchscript.
可以將第一種類型轉(zhuǎn)化為第二種,參數(shù)一的類型做輸入,參數(shù)二的類型做輸出,輸入一定要對應,不然就會報錯
代碼示例
trans_totensor = transforms.ToTensor() trans_resize_2 = transforms.Resize(512) # PIL -> tensor trans_compose = transforms.Compose([trans_resize_2, trans_totensor]) img_resize_2 = trans_compose(img) writer.add_image("Resize", img_resize_2, 1)
到此這篇關于pytroch中transforms的使用詳解的文章就介紹到這了,更多相關pytroch transforms的使用內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
python使用matplotlib:subplot繪制多個子圖的示例
這篇文章主要介紹了python使用matplotlib:subplot繪制多個子圖的示例,幫助大家更好的利用python繪制圖像,感興趣的朋友可以了解下2020-09-09python通過opencv調(diào)用攝像頭操作實例分析
在本篇文章里小編給大家整理的是一篇關于python通過opencv調(diào)用攝像頭操作實例分析內(nèi)容,有興趣的朋友們可以學習下。2021-06-06在Pandas中導入CSV數(shù)據(jù)時去除默認索引的方法匯總
在Pandas中讀取CSV數(shù)據(jù)時,會默認將第一列設為索引列index,但有時候我們并不需要索引,或者希望指定自己的索引列,本文將介紹幾種在Pandas中導入CSV數(shù)據(jù)時去除默認索引的方法,需要的朋友可以參考下2023-05-05Python網(wǎng)絡安全格式字符串漏洞任意地址覆蓋大數(shù)字詳解
這篇文章主要介紹了Python網(wǎng)絡安全格式字符串漏洞任意地址覆蓋大數(shù)字的示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步2021-10-10