快捷導(dǎo)航

淺談keras中Dropout在預(yù)測過程中是否仍要起作用

更新時間：2020年07月09日 09:04:53 作者：zyl681327

這篇文章主要介紹了淺談keras中Dropout在預(yù)測過程中是否仍要起作用，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

因為需要，要重寫訓練好的keras模型，雖然只具備預(yù)測功能，但是發(fā)現(xiàn)還是有很多坑要趟過。其中Dropout這個坑，我記憶猶新。

一開始，我以為預(yù)測時要保持和訓練時完全一樣的網(wǎng)絡(luò)結(jié)構(gòu)，也就是預(yù)測時用的網(wǎng)絡(luò)也是有丟棄的網(wǎng)絡(luò)節(jié)點，但是這樣想就掉進了一個大坑！因為無法通過已經(jīng)訓練好的模型，來獲取其訓練時隨機丟棄的網(wǎng)絡(luò)節(jié)點是那些，這本身就根本不可能。

更重要的是：我發(fā)現(xiàn)每一個迭代周期丟棄的神經(jīng)元也不完全一樣。

假若迭代500次，網(wǎng)絡(luò)共有1000個神經(jīng)元，在第n（1<= n <500）個迭代周期內(nèi)，從1000個神經(jīng)元里隨機丟棄了200個神經(jīng)元，在n+1個迭代周期內(nèi)，會在這1000個神經(jīng)元里（不是在剩余得800個）重新隨機丟棄200個神經(jīng)元。

訓練過程中，使用Dropout，其實就是對部分權(quán)重和偏置在某次迭代訓練過程中，不參與計算和更新而已，并不是不再使用這些權(quán)重和偏置了(預(yù)測時，會使用全部的神經(jīng)元，包括使用訓練時丟棄的神經(jīng)元)。

也就是說在預(yù)測過程中完全沒有Dropout什么事了，他只是在訓練時有用，特別是針對訓練集比較小時防止過擬合非常有用。

補充知識：TensorFlow直接使用ckpt模型predict不用restore

我就廢話不多說了，大家還是直接看代碼吧~

# -*- coding: utf-8 -*-
# from util import *
import cv2
import numpy as np
import tensorflow as tf
# from tensorflow.python.framework import graph_util
import os

os.environ['CUDA_DEVICE_ORDER'] = 'PCI_BUS_ID'
os.environ['CUDA_VISIBLE_DEVICES'] = '0'
image_path = './8760.pgm'

input_checkpoint = './model/xu_spatial_model_1340.ckpt'

sess = tf.Session()
saver = tf.train.import_meta_graph(input_checkpoint + '.meta')
saver.restore(sess, input_checkpoint)

# input:0作為輸入圖像,keep_prob:0作為dropout的參數(shù),測試時值為1,is_training:0訓練參數(shù)
input_image_tensor = sess.graph.get_tensor_by_name("coef_input:0")
is_training = sess.graph.get_tensor_by_name('is_training:0')
batch_size = sess.graph.get_tensor_by_name('batch_size:0')
# 定義輸出的張量名稱
output_tensor_name = sess.graph.get_tensor_by_name("xuNet/logits:0") # xuNet/Logits/logits
image = cv2.imread(image_path, 0)
# 讀取測試圖片
out = sess.run(output_tensor_name, feed_dict={input_image_tensor: np.reshape(image, (1, 512, 512, 1)),
                       is_training: False,
                       batch_size: 1})
print(out)

ckpt模型中的所有節(jié)點名稱，可以這樣查看