解決pytorch下出現(xiàn)multi-target not supported at的一種可能原因
在使用交叉熵損失函數(shù)的時候,target的形狀應(yīng)該是和label的形狀一致或者是只有batchsize這一個維度的。
如果target是這樣的【batchszie,1】就會出現(xiàn)上述的錯誤。
改一下試試,用squeeze()函數(shù)降低緯度,
如果不知道squeeze怎么用的,
可以參考這篇文章。pytorch下的unsqueeze和squeeze用法
這只是一種可能的原因。
補充:pytorch使用中遇到的問題
1. load模型參數(shù)文件時,提示torch.cuda.is_available() is False。
按照pytorch官方網(wǎng)頁又安裝了一次pytorch,而不是直接使用清華源,執(zhí)行pip install torch,暫時不知道為什么。
2. 使用CrossEntropyLoss時,要求第一個參數(shù)為網(wǎng)絡(luò)輸出值,F(xiàn)loatTensor類型,第二個參數(shù)為目標(biāo)值,LongTensor類型。否則
需要在數(shù)據(jù)讀取的迭代其中把target的類型轉(zhuǎn)換為int64位的:target = target.astype(np.int64),這樣,輸出的target類型為torch.cuda.LongTensor。(或者在使用前使用Tensor.type(torch.LongTensor)進行轉(zhuǎn)換)。
3.
RuntimeError: multi-target not supported at /pytorch/torch/lib/THCUNN/generic/ClassNLLCriterion.cu loss += F.cross_entropy( scores, captions )
出錯原因:
scores, captions的維度與F.cross_entropy()函數(shù)要求的維度不匹配,
例如出錯的維度為scores=[batch, vocab_size], captions=[batch, 1]
解決:
loss += F.cross_entropy( scores, captions.squeeze() )
注,這個scores必須是N*C維,C指類別數(shù)。
4. pytorch訓(xùn)練過程中使用大量的CPU資源
當(dāng)我使用pycharm運行 (https://github.com/Joyce94/cnn-text-classification-pytorch ) pytorch程序的時候,在Linux服務(wù)器上會開啟多個進程,占用服務(wù)器的大量的CPU,在windows10上運行此程序的時候,本機的CPU和內(nèi)存會被吃光,是因為在train.py中有大量的數(shù)據(jù)訓(xùn)練處理,會開啟多個進程,占用大量的CPU和進程。
本機window10
linux服務(wù)器開啟了多個進程
Linux服務(wù)器占用大量CPU
在pytorch中提供了(http://pytorch.org/docs/master/multiprocessing.html)muliprocessing多進程管理,其中有Pool進程池、Process()等對進程進行管理,可能是我使用的方式不對,反正是沒有什么效果。
然而最簡單的也是最好的解決辦法 :
torch.set_num_threads(int thread) ,可以很好的解決windows問題,參考(http://pytorch.org/docs/master/torch.html#parallelism) 然而,在linux服務(wù)器上還是有一些問題的,export OMP_NUM_THREADS = 1 可以解決Linux問題。
經(jīng)驗證:export OMP_NUM_THREADS=1確實在pycaffe/pytorch中可以有效降低CPU使用率且提高程序運行速度,考慮可能是程序并不需要這么大的計算量,但是開了很多線程并行進行相同的計算,最后還需要同步結(jié)果,浪費了大量的計算量。
5. 在pytorch框架下編譯模塊的時候遇到 in <module>
raise ImportError("torch.utils.ffi is deprecated. Please use cpp extensions instead.") ImportError: torch.utils.ffi is deprecated. Please use cpp extensions instead.
解決:pytorch版本與其他庫的版本不匹配。我當(dāng)時裝的是1.0.0,降低版本到0.4.0后問題解決。
6.pytorch設(shè)置GPU,os.environ['CUDA_VISIBLE_DEVICES']='X'要放在主程序的最前端,否則設(shè)置GPU可能無效。
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
TensorFlow2.X使用圖片制作簡單的數(shù)據(jù)集訓(xùn)練模型
這篇文章主要介紹了TensorFlow2.X使用圖片制作簡單的數(shù)據(jù)集訓(xùn)練模型,本文通過截圖實例代碼相結(jié)合給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-04-04Django框架ORM操作數(shù)據(jù)庫不生效問題示例解決方法
本文詳細描述使用Django 的ORM框架操作PostgreSQL數(shù)據(jù)庫刪除不生效問題的定位過程及解決方案,并總結(jié)使用ORM框架操作數(shù)據(jù)庫不生效的問題的通用定位方法,感興趣的朋友跟隨小編一起看看吧2023-01-01