pytorch 如何用cuda處理數據
1 設置GPU的一些操作
設置在os端哪些GPU可見,如果不可見,那肯定是不能夠調用的~
import os GPU = '0,1,2' os.environ['CUDA_VISIBLE_DEVICES'] =GPU
torch.cuda.is_available()查看cuda是否可用。
if torch.cuda.is_available(): torch.backends.cudnn.benchmark = True ''' 如果網絡的輸入數據維度或類型上變化不大,設置 torch.backends.cudnn.benchmark = true 可以增加運行效率; 如果網絡的輸入數據在每次 iteration 都變化的話,會導致 cnDNN 每次都會去尋找一遍最優(yōu)配置, 這樣反而會降低運行效率。 這下就清晰明了很多了。 Benchmark模式會提升計算速度,但是由于計算中有隨機性,每次網絡前饋結果略有差異。 torch.backends.cudnn.benchmark = True 如果想要避免這種結果波動,設置: torch.backends.cudnn.deterministic = True '''
這句話也很常見,設置默認的device,優(yōu)先gpu。
device = 'cuda' if torch.cuda.is_available() else 'cpu'
cpu挪到gpu
# 也可以是 device = torch.device('cuda:0') device = torch.device('cuda') a = torch.tensor([1,2,3]) b = a.to(device ) print(a) print(b)
out:
tensor([1, 2, 3])
tensor([1, 2, 3], device='cuda:0')
判斷變量是否基于GPU。
a.is_cuda
查看有幾個可用GPU。
torch.cuda.device_count()
查看GPU算力
# 返回gpu最大和最小計算能力,是一個tuple torch.cuda.get_device_capability()
設置默認哪一個GPU運算。
# 里面輸入int類型的數字 torch.cuda.set_device()
抓取指定gpu的全名。
if torch.cuda.is_available(): device = torch.device('cuda') print('Using GPU: ', torch.cuda.get_device_name(0))
out:
'GeForce GTX 1050'
2 直接在gpu創(chuàng)建
方法一:
a = torch.ones(3,4,device="cuda") print(a)
out:
tensor([[1., 1., 1., 1.],
[1., 1., 1., 1.],
[1., 1., 1., 1.]], device='cuda:0')
方法二:
a = torch.cuda.FloatTensor(3, 4) print(a)
out:
tensor([[-1., -1., -1., -1.],
[-1., -1., -1., -1.],
[-1., -1., -1., -1.]], device='cuda:0')
3 從cpu轉移到gpu
方法一:tensor.to()
a = torch.ones(3,4) b = a.to("cuda") print(a) print(b)
out:
tensor([[1., 1., 1., 1.],
[1., 1., 1., 1.],
[1., 1., 1., 1.]])
tensor([[1., 1., 1., 1.],
[1., 1., 1., 1.],
[1., 1., 1., 1.]], device='cuda:0')
注意:.to()不僅可以轉移device,還可以修改數據類型,比如:a.to(torch.double)
方法二:tensor.cuda()
a = torch.tensor([1., 2.]).cuda()
方法三:tensor.type()
dtype = torch.cuda.FloatTensor x = torch.rand(2,2).type(dtype)
方法四:torch.from_numpy(np_labels).cuda()
wm_labels = torch.from_numpy(np_labels).cuda()
4 在cuda中訓練模型
在默認情況下,模型參數的優(yōu)化(即訓練)是在cpu上進行的,如果想要挪到GPU,得做如下修改:
import torch.nn as nn #假設前面已經定義好了模型 #創(chuàng)建模型 Hidnet = UnetGenerator_mnist() #把模型放入GPU Hidnet = nn.DataParallel(Hidnet.cuda()) #查看模型參數 list(Hidnet.parameters())[0]
out:
Parameter containing:
tensor([[[[ 0.1315, 0.0562, 0.1186],
[-0.1158, 0.1394, -0.0399],
[ 0.1728, 0.1051, -0.1034]],[[ 0.1702, -0.1208, -0.1134],
[-0.1449, 0.1912, 0.1727],
[ 0.1562, 0.1601, 0.1055]],[[ 0.1031, -0.0062, -0.0068],
[-0.0453, 0.1150, 0.0366],
[ 0.0680, -0.1234, -0.0988]]]], device='cuda:0', requires_grad=True)
可以看到 device=‘cuda:0' 啦
pytorch 查看cuda 版本
由于pytorch的whl 安裝包名字都一樣,所以我們很難區(qū)分到底是基于cuda 的哪個版本。
有一條指令可以查看
import torch print(torch.version.cuda)
以上為個人經驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
- python?windows安裝cuda+cudnn+pytorch教程
- 顯卡驅動CUDA?和?pytorch?CUDA?之間的區(qū)別
- pytorch?cuda安裝報錯的解決方法
- PyTorch中的CUDA的操作方法
- PyTorch?device與cuda.device用法介紹
- 將pytorch的網絡等轉移到cuda
- pytorch中.to(device) 和.cuda()的區(qū)別說明
- PyTorch CUDA環(huán)境配置及安裝的步驟(圖文教程)
- Linux安裝Pytorch1.8GPU(CUDA11.1)的實現
- 詳解win10下pytorch-gpu安裝以及CUDA詳細安裝過程
- Pytorch使用CUDA流(CUDA?stream)的實現
相關文章
解決遇到:PytorchStreamReader failed reading zip&n
本文針對"PytorchStreamReaderfailedreadingziparchive:failedfindingcentral"錯誤提出解決方案,包括檢查文件完整性、文件路徑,嘗試更新PyTorch版本,檢查壓縮文件格式,代碼問題,或尋求技術支持等,希望這些經驗能給遇到同樣問題的人一個參考2024-09-09Python實現獲取nginx服務器ip及流量統(tǒng)計信息功能示例
這篇文章主要介紹了Python實現獲取nginx服務器ip及流量統(tǒng)計信息功能,涉及Python針對nginx服務器信息操作相關實現技巧,需要的朋友可以參考下2018-05-05解決在keras中使用model.save()函數保存模型失敗的問題
這篇文章主要介紹了解決在keras中使用model.save()函數保存模型失敗的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-05-05Pycharm?debug程序,跳轉至指定循環(huán)條件/循環(huán)次數問題
這篇文章主要介紹了Pycharm?debug程序,跳轉至指定循環(huán)條件/循環(huán)次數問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-08-08Django用戶認證系統(tǒng) Web請求中的認證解析
這篇文章主要介紹了Django用戶認證系統(tǒng) Web請求中的認證解析,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下2019-08-08