Pytorch之ToPILImage()不輸出圖片問題及解決
Pytorch ToPILImage()不輸出圖片
先導(dǎo)torchvision包
from PIL import Image from torchvision.transforms import ToTensor,ToPILImage
定義轉(zhuǎn)換操作
img_to_tensor = ToTensor() # img -> tensor tensor_to_pil = ToPILImage() # tensor -> img
讀取圖片
img = Image.open('../test.jpg') # ‘' 引號內(nèi)為要讀取圖片的相對路徑
把讀取的圖片轉(zhuǎn)換成tensor進(jìn)而對其操作,
unsqueeze(0)是在給轉(zhuǎn)換后的tensor加一個維度
input = img_to_tensor(img).unsqueeze(0) #torch.Size([1, 3, 960, 720])
對圖像進(jìn)行一個簡單的操作,此處用的3*3的kernel進(jìn)行銳化卷積
kernel = t.ones(3,3)/-9. kernel[1][1] = 1 conv = nn.Conv2d(1,1,(3,3),1,bias=False) #卷積 conv.weight.data = kernel.view(1,1,3,3) #權(quán)重
將圖片傳入卷積層,并輸出
out = conv(V(input)) tensor_to_pil(out.data.squeeze(0)).show()
注意,此處若不用.show()則輸出臺無顯示。
另附torchvision.transforms.ToTensor及torchvision.transforms.ToPILImage的轉(zhuǎn)換過程
torchvision.transforms.ToTensor
對于一個圖片img,調(diào)用ToTensor轉(zhuǎn)化成張量的形式,發(fā)生的不是將圖片的RGB三維信道矩陣變成tensor
圖片在內(nèi)存中以bytes的形式存儲,轉(zhuǎn)化過程的步驟是:
- img.tobytes() 將圖片轉(zhuǎn)化成內(nèi)存中的存儲格式
- torch.BytesStorage.frombuffer(img.tobytes() ) 將字節(jié)以流的形式輸入,轉(zhuǎn)化成一維的張量
- 對張量進(jìn)行reshape
- 對張量進(jìn)行permute(2,0,1)
- 將當(dāng)前張量的每個元素除以255
- 輸出張量
torchvision.transforms.ToPILImage
對于一個Tensor的轉(zhuǎn)化過程是:
- 將張量的每個元素乘上255
- 將張量的數(shù)據(jù)類型有FloatTensor轉(zhuǎn)化成Uint8
- 將張量轉(zhuǎn)化成numpy的ndarray類型
- 對ndarray對象做permute (1, 2, 0)的操作
- 利用Image下的fromarray函數(shù),將ndarray對象轉(zhuǎn)化成PILImage形式
- 輸出PILImage
總結(jié)
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python實現(xiàn)國外賭場熱門游戲Craps(雙骰子)
這篇文章主要介紹了Python實現(xiàn)國外賭場熱門游戲Craps(雙骰子)的源碼及運行方法,十分簡單,有需要的小伙伴可以參考下。2015-03-03腳本測試postman快速導(dǎo)出python接口測試過程示例
這篇文章主要介紹了關(guān)于腳本測試postman快速導(dǎo)出python接口測試示例的過程操作,有需要的朋友可以借鑒參考下,希望能夠有所幫助2021-09-09在Ubuntu系統(tǒng)中運行python代碼的幾個步驟
項目中需要在Linux上運行自己寫的python腳本,特此記錄一下操作流程,整個流程比較簡單,下面這篇文章主要給大家介紹了關(guān)于在Ubuntu系統(tǒng)中運行python代碼的幾個步驟,需要的朋友可以參考下2023-12-12