快捷導(dǎo)航

keras實(shí)現(xiàn)多GPU或指定GPU的使用介紹

更新時(shí)間：2020年06月17日 16:36:58 作者：shuangyumelody

這篇文章主要介紹了keras實(shí)現(xiàn)多GPU或指定GPU的使用介紹，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來看看吧

1. keras新版本中加入多GPU并行使用的函數(shù)

下面程序段即可實(shí)現(xiàn)一個(gè)或多個(gè)GPU加速：

注意：使用多GPU加速時(shí)，Keras版本必須是Keras2.0.9以上版本

from keras.utils.training_utils import multi_gpu_model  #導(dǎo)入keras多GPU函數(shù)
import VGG19   #導(dǎo)入已經(jīng)寫好的函數(shù)模型，例如VGG19

if G <= 1:
  print("[INFO] training with 1 GPU...")
  model = VGG19（）

# otherwise, we are compiling using multiple GPUs
else:
  print("[INFO] training with {} GPUs...".format(G))
  # we'll store a copy of the model on *every* GPU and then combine
  # the results from the gradient updates on the CPU
  with tf.device("/cpu:0"):
    # initialize the model
    model1 = VGG19（）
    # make the model parallel(if you have more than 2 GPU)
    model = multi_gpu_model(model1, gpus=G)

2.指定使用某個(gè)GPU

首先在終端查看主機(jī)中GPU編號(hào)：

watch -n -9 nvidia-smi

查詢結(jié)果如下所示：

顯示主機(jī)中只有一塊GPU，編號(hào)為0

2.1 下面方法是直接在終端運(yùn)行時(shí)加入相關(guān)語句實(shí)現(xiàn)指定GPU的使用

export CUDA_VISIBLE_DEVICES=0 python test.py
# 表示運(yùn)行test.py文件時(shí)，使用編號(hào)為0的GPU卡
export CUDA_VISIBLE_DEVICES=0,2 python test.py
# 表示運(yùn)行test.py文件時(shí)，使用編號(hào)為0和2的GPU卡

2.2 下面方法是在Python程序中添加

import os
# 使用第一張與第三張GPU卡
os.environ["CUDA_VISIBLE_DEVICES"] = "0, 2"

補(bǔ)充知識(shí)：踩坑記----large batch_size cause low var_acc

有時(shí)候，我們在訓(xùn)練模型前期，會(huì)出現(xiàn)很高的train_acc(訓(xùn)練準(zhǔn)確率),但var_acc（驗(yàn)證準(zhǔn)確率）卻很低。這往往是因?yàn)槲覀兡Ｐ驮谟?xùn)練過程中已經(jīng)進(jìn)入局部最優(yōu)，或者出現(xiàn)過擬合的現(xiàn)象。造成這種情況有多種原因，我只提出以下幾點(diǎn)，有補(bǔ)充的可以在下面留言，我補(bǔ)充。

（1）.訓(xùn)練數(shù)據(jù)分布不均勻，可能你的訓(xùn)練數(shù)據(jù)某一類別占據(jù)了大多數(shù)，比如95%的數(shù)據(jù)為蘋果，5%的數(shù)據(jù)為其他類別，那么模型為了擬合訓(xùn)練數(shù)據(jù)，則模型會(huì)偏袒于把識(shí)別結(jié)果歸屬于蘋果，而驗(yàn)證集的數(shù)據(jù)是正常的，那么便會(huì)出現(xiàn)高train_acc，低val_acc。

（2）.訓(xùn)練數(shù)據(jù)沒有shuffle，那么整個(gè)batch里面將會(huì)是同一個(gè)類別數(shù)據(jù)，比如都為蘋果的圖片，那么訓(xùn)練一個(gè)batch，那么模型輸出將會(huì)往這一類別靠攏，會(huì)形成一個(gè)很高的acc的假象，但這個(gè)模型泛化能力卻很低，因?yàn)檫@個(gè)模型都只會(huì)為了擬合這批同類的數(shù)據(jù)。

（3）.訓(xùn)練集跟驗(yàn)證集的預(yù)處理不一致，這個(gè)是細(xì)節(jié)問題，輸入的圖片分布不一致，那么必然會(huì)影響到驗(yàn)證結(jié)果。

（4）.模型過于復(fù)雜，造成過擬合現(xiàn)象，特別是在于訓(xùn)練數(shù)據(jù)集不多的情況下，更容易出現(xiàn)過擬合。

（5）.這個(gè)也是最難發(fā)現(xiàn)的，就是過大的batch_size，造成訓(xùn)練前期，模型還未收斂，出現(xiàn)很高的train_acc，卻有很低的val_acc，親測，在120個(gè)類別，參數(shù)只有七萬的分類模型中，在batch-size等于64的情況下，在第二個(gè)epoch時(shí)，train_acc達(dá)到80%，val_acc卻只有6%，train_loss跟val_loss也是相差很大，而在batch_size在等于8的情況下，在第二個(gè)epoch，train_acc跟val_acc皆能達(dá)到60%，且還有上升的趨勢。至于為什么，個(gè)人認(rèn)為，模型在大的batch_size的情況下，模型泛化能力下降，且更難擬合，每個(gè)epoch所包含的step也更少，且在adam的優(yōu)化算法，前期的學(xué)習(xí)率較高，模型出現(xiàn)了振蕩，一直在局部最優(yōu)值徘徊，具體原因不知。

接下來分析下，batc_size對(duì)模型的影響：

large batch_size:

好處：訓(xùn)練的更快，每一step都包含更多的訓(xùn)練集，模型準(zhǔn)確率會(huì)更高，不容易受到噪聲的影響，穩(wěn)定性更好。

small batch_size:

好處：不容易陷入局部最優(yōu)，泛化能力更強(qiáng)。

總結(jié)：

（1）.large batch_size，雖然訓(xùn)練模型的訓(xùn)練誤差會(huì)更低，但往往在execute的時(shí)候，效果卻不盡人意。

（2）.在時(shí)間允許的情況下，建議batch_size在32或以下。

以上這篇keras實(shí)現(xiàn)多GPU或指定GPU的使用介紹就是小編分享給大家的全部內(nèi)容了，希望能給大家一個(gè)參考，也希望大家多多支持腳本之家。

您可能感興趣的文章: