基于TensorFlow的CNN實(shí)現(xiàn)Mnist手寫數(shù)字識(shí)別

更新時(shí)間：2020年06月17日 09:57:15 作者：Asia-Lee

這篇文章主要為大家詳細(xì)介紹了基于TensorFlow的CNN實(shí)現(xiàn)Mnist手寫數(shù)字識(shí)別，文中示例代碼介紹的非常詳細(xì)，具有一定的參考價(jià)值，感興趣的小伙伴們可以參考一下

本文實(shí)例為大家分享了基于TensorFlow的CNN實(shí)現(xiàn)Mnist手寫數(shù)字識(shí)別的具體代碼，供大家參考，具體內(nèi)容如下

一、CNN模型結(jié)構(gòu)

輸入層：Mnist數(shù)據(jù)集（28*28）
第一層卷積：感受視野5*5，步長(zhǎng)為1，卷積核：32個(gè)
第一層池化：池化視野2*2，步長(zhǎng)為2
第二層卷積：感受視野5*5，步長(zhǎng)為1，卷積核：64個(gè)
第二層池化：池化視野2*2，步長(zhǎng)為2
全連接層：設(shè)置1024個(gè)神經(jīng)元
輸出層：0~9十個(gè)數(shù)字類別

二、代碼實(shí)現(xiàn)

import tensorflow as tf
#Tensorflow提供了一個(gè)類來處理MNIST數(shù)據(jù)
from tensorflow.examples.tutorials.mnist import input_data
import time
 
#載入數(shù)據(jù)集
mnist=input_data.read_data_sets('MNIST_data',one_hot=True)
#設(shè)置批次的大小
batch_size=100
#計(jì)算一共有多少個(gè)批次
n_batch=mnist.train.num_examples//batch_size
 
#定義初始化權(quán)值函數(shù)
def weight_variable(shape):
 initial=tf.truncated_normal(shape,stddev=0.1)
 return tf.Variable(initial)
#定義初始化偏置函數(shù)
def bias_variable(shape):
 initial=tf.constant(0.1,shape=shape)
 return tf.Variable(initial)
#卷積層
def conv2d(input,filter):
 return tf.nn.conv2d(input,filter,strides=[1,1,1,1],padding='SAME')
#池化層
def max_pool_2x2(value):
 return tf.nn.max_pool(value,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')
 
 
#輸入層
#定義兩個(gè)placeholder
x=tf.placeholder(tf.float32,[None,784]) #28*28
y=tf.placeholder(tf.float32,[None,10])
#改變x的格式轉(zhuǎn)為4維的向量[batch,in_hight,in_width,in_channels]
x_image=tf.reshape(x,[-1,28,28,1])
 
 
#卷積、激勵(lì)、池化操作
#初始化第一個(gè)卷積層的權(quán)值和偏置
W_conv1=weight_variable([5,5,1,32]) #5*5的采樣窗口，32個(gè)卷積核從1個(gè)平面抽取特征
b_conv1=bias_variable([32]) #每一個(gè)卷積核一個(gè)偏置值
#把x_image和權(quán)值向量進(jìn)行卷積，再加上偏置值，然后應(yīng)用于relu激活函數(shù)
h_conv1=tf.nn.relu(conv2d(x_image,W_conv1)+b_conv1)
h_pool1=max_pool_2x2(h_conv1) #進(jìn)行max_pooling 池化層
 
#初始化第二個(gè)卷積層的權(quán)值和偏置
W_conv2=weight_variable([5,5,32,64]) #5*5的采樣窗口，64個(gè)卷積核從32個(gè)平面抽取特征
b_conv2=bias_variable([64])
#把第一個(gè)池化層結(jié)果和權(quán)值向量進(jìn)行卷積，再加上偏置值，然后應(yīng)用于relu激活函數(shù)
h_conv2=tf.nn.relu(conv2d(h_pool1,W_conv2)+b_conv2)
h_pool2=max_pool_2x2(h_conv2) #池化層
 
#28*28的圖片第一次卷積后還是28*28，第一次池化后變?yōu)?4*14
#第二次卷積后為14*14，第二次池化后變?yōu)榱?*7
#經(jīng)過上面操作后得到64張7*7的平面
 
 
#全連接層
#初始化第一個(gè)全連接層的權(quán)值
W_fc1=weight_variable([7*7*64,1024])#經(jīng)過池化層后有7*7*64個(gè)神經(jīng)元，全連接層有1024個(gè)神經(jīng)元
b_fc1 = bias_variable([1024])#1024個(gè)節(jié)點(diǎn)
#把池化層2的輸出扁平化為1維
h_pool2_flat = tf.reshape(h_pool2,[-1,7*7*64])
#求第一個(gè)全連接層的輸出
h_fc1=tf.nn.relu(tf.matmul(h_pool2_flat,W_fc1)+b_fc1)
 
#keep_prob用來表示神經(jīng)元的輸出概率
keep_prob=tf.placeholder(tf.float32)
h_fc1_drop=tf.nn.dropout(h_fc1,keep_prob)
 
#初始化第二個(gè)全連接層
W_fc2=weight_variable([1024,10])
b_fc2=bias_variable([10])
 
#輸出層
#計(jì)算輸出
prediction=tf.nn.softmax(tf.matmul(h_fc1_drop,W_fc2)+b_fc2)
 
#交叉熵代價(jià)函數(shù)
cross_entropy=tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y,logits=prediction))
#使用AdamOptimizer進(jìn)行優(yōu)化
train_step=tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)
#結(jié)果存放在一個(gè)布爾列表中(argmax函數(shù)返回一維張量中最大的值所在的位置)
correct_prediction=tf.equal(tf.argmax(prediction,1),tf.argmax(y,1))
#求準(zhǔn)確率(tf.cast將布爾值轉(zhuǎn)換為float型)
accuracy=tf.reduce_mean(tf.cast(correct_prediction,tf.float32))
 
#創(chuàng)建會(huì)話
with tf.Session() as sess:
 start_time=time.clock()
 sess.run(tf.global_variables_initializer()) #初始化變量
 for epoch in range(21): #迭代21次（訓(xùn)練21次）
 for batch in range(n_batch):
 batch_xs,batch_ys=mnist.train.next_batch(batch_size)
 sess.run(train_step,feed_dict={x:batch_xs,y:batch_ys,keep_prob:0.7}) #進(jìn)行迭代訓(xùn)練
 #測(cè)試數(shù)據(jù)計(jì)算出準(zhǔn)確率
 acc=sess.run(accuracy,feed_dict={x:mnist.test.images,y:mnist.test.labels,keep_prob:1.0})
 print('Iter'+str(epoch)+',Testing Accuracy='+str(acc))
 end_time=time.clock()
 print('Running time:%s Second'%(end_time-start_time)) #輸出運(yùn)行時(shí)間

運(yùn)行結(jié)果：

三、TensorFlow主要函數(shù)說明

1、卷積層

tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, data_format=None, name=None)

（1）data_format：表示輸入的格式，有兩種分別為：“NHWC”和“NCHW”，默認(rèn)為“NHWC”

（2）input：輸入是一個(gè)4維格式的（圖像）數(shù)據(jù)，數(shù)據(jù)的 shape 由 data_format 決定：當(dāng) data_format 為“NHWC”輸入數(shù)據(jù)的shape表示為[batch, in_height, in_width, in_channels]，分別表示訓(xùn)練時(shí)一個(gè)batch的圖片數(shù)量、圖片高度、圖片寬度、圖像通道數(shù)。當(dāng) data_format 為“NHWC”輸入數(shù)據(jù)的shape表示為[batch, in_channels， in_height, in_width]

（3）filter：卷積核是一個(gè)4維格式的數(shù)據(jù)：shape表示為：[height,width,in_channels, out_channels]，分別表示卷積核的高、寬、深度（與輸入的in_channels應(yīng)相同）、輸出 feature map的個(gè)數(shù)（即卷積核的個(gè)數(shù)）。

（4）strides：表示步長(zhǎng)：一個(gè)長(zhǎng)度為4的一維列表，每個(gè)元素跟data_format互相對(duì)應(yīng)，表示在data_format每一維上的移動(dòng)步長(zhǎng)。當(dāng)輸入的默認(rèn)格式為：“NHWC”，則 strides = [batch , in_height , in_width, in_channels]。其中 batch 和 in_channels 要求一定為1，即只能在一個(gè)樣本的一個(gè)通道上的特征圖上進(jìn)行移動(dòng)，in_height , in_width表示卷積核在特征圖的高度和寬度上移動(dòng)的布長(zhǎng)。

（5）padding：表示填充方式：“SAME”表示采用填充的方式，簡(jiǎn)單地理解為以0填充邊緣，當(dāng)stride為1時(shí)，輸入和輸出的維度相同；“VALID”表示采用不填充的方式，多余地進(jìn)行丟棄。

對(duì)于卷積操作：

2、池化層

#池化層：
#Max pooling：取“池化視野”矩陣中的最大值
tf.nn.max_pool( value, ksize,strides,padding,data_format='NHWC',name=None)
#Average pooling：取“池化視野”矩陣中的平均值
tf.nn.avg_pool(value, ksize,strides,padding,data_format='NHWC',name=None)

參數(shù)說明：

（1）value：表示池化的輸入：一個(gè)4維格式的數(shù)據(jù)，數(shù)據(jù)的 shape 由 data_format 決定，默認(rèn)情況下shape 為[batch, height, width, channels]

（2）ksize：表示池化窗口的大?。阂粋€(gè)長(zhǎng)度為4的一維列表，一般為[1, height, width, 1]，因不想在batch和channels上做池化，則將其值設(shè)為1。

（3）其他參數(shù)與 tf.nn.cov2d 類型

對(duì)于池化操作：