快捷導(dǎo)航

Tensorflow輕松實(shí)現(xiàn)XOR運(yùn)算的方式

更新時(shí)間：2020年02月03日 17:55:23 作者：beyond_LH

今天小編就為大家分享一篇Tensorflow輕松實(shí)現(xiàn)XOR運(yùn)算的方式，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來(lái)看看吧

對(duì)于“XOR”大家應(yīng)該都不陌生，我們?cè)诟鞣N課程中都會(huì)遇到，它是一個(gè)數(shù)學(xué)邏輯運(yùn)算符號(hào)，在計(jì)算機(jī)中表示為“XOR”，在數(shù)學(xué)中表示為“”，學(xué)名為“異或”，其來(lái)源細(xì)節(jié)就不詳細(xì)表明了，說(shuō)白了就是兩個(gè)a、b兩個(gè)值做異或運(yùn)算，若a=b則結(jié)果為0，反之為1，即“相同為0，不同為1”.

在計(jì)算機(jī)早期發(fā)展中，邏輯運(yùn)算廣泛應(yīng)用于電子管中，這一點(diǎn)如果大家學(xué)習(xí)過微機(jī)原理應(yīng)該會(huì)比較熟悉，那么在神經(jīng)網(wǎng)絡(luò)中如何實(shí)現(xiàn)它呢，早先我們使用的是感知機(jī)，可理解為單層神經(jīng)網(wǎng)絡(luò)，只有輸入層和輸出層（在吳恩達(dá)老師的系列教程中曾提到過這一點(diǎn)，關(guān)于神經(jīng)網(wǎng)絡(luò)的層數(shù)，至今仍有異議，就是說(shuō)神經(jīng)網(wǎng)絡(luò)的層數(shù)到底包不包括輸入層，現(xiàn)今多數(shù)認(rèn)定是不包括的，我們常說(shuō)的N層神經(jīng)網(wǎng)絡(luò)指的是隱藏層+輸出層），但是感知機(jī)是無(wú)法實(shí)現(xiàn)XOR運(yùn)算的，簡(jiǎn)單來(lái)說(shuō)就是XOR是線性不可分的，由于感知機(jī)是有輸入輸出層，無(wú)法線性劃分XOR區(qū)域，于是后來(lái)就有了使用多層神經(jīng)網(wǎng)絡(luò)來(lái)解決這一問題的想法～～

關(guān)于多層神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)XOR運(yùn)算可大致這么理解：

兩個(gè)輸入均有兩個(gè)取值0和1，那么組合起來(lái)就有四種可能，即[0，0]、[0，1]、[1，0]、[1，1]，這樣就可以通過中間的隱藏層進(jìn)行異或運(yùn)算了～

咱們直接步入正題吧，對(duì)于此次試驗(yàn)我們只需要一個(gè)隱藏層即可，關(guān)于神經(jīng)網(wǎng)絡(luò) 的基礎(chǔ)知識(shí)建議大家去看一下吳恩達(dá)大佬的課程，真的很棒，百看不厭，真正的大佬是在認(rèn)定學(xué)生是絕對(duì)小白的前提下去講解的，所以一般人都能聽懂～～接下來(lái)的圖純手工操作，可能不是那么準(zhǔn)確，但中心思想是沒有問題的，我們開始吧：

上圖是最基本的神經(jīng)網(wǎng)絡(luò)示意圖，有兩個(gè)輸入x1、x2，一個(gè)隱藏層，只有一個(gè)神經(jīng)元，然后有個(gè)輸出層，這就是最典型的“輸入層+隱藏層+輸出層”的架構(gòu)，對(duì)于本題目，我們的輸入和輸出以及整體架構(gòu)如下圖所示：

輸入量為一個(gè)矩陣，0和0異或結(jié)果為0，0和1異或結(jié)果為1，依次類推，對(duì)應(yīng)我們的目標(biāo)值為[0，1，1，0],最后之所以用約等號(hào)是因?yàn)槲覀兊念A(yù)測(cè)值與目標(biāo)值之間會(huì)有一定的偏差，如果訓(xùn)練的好那么這二者之間是無(wú)限接近的。

我們直接上全部代碼吧，就不分步進(jìn)行了，以為這個(gè)實(shí)驗(yàn)本身難度較低，且代碼注釋很清楚，每一步都很明確，如果大家有什么不理解的可以留言給我，看到必回：

#!/usr/bin/env python 
# -*- coding:utf-8 -*-
 
import numpy as np
import tensorflow as tf
 
#定義輸入值與目標(biāo)值
X=np.array([[0,0],[0,1],[1,0],[1,1]])
Y=np.array([[0],[1],[1],[0]])
 
#定義占位符，從輸入或目標(biāo)中按行取數(shù)據(jù)
x=tf.placeholder(tf.float32,[None,2])
y=tf.placeholder(tf.float32,[None,1])
 
#初始化權(quán)重，使其滿足正態(tài)分布，w1和w2分別為輸入層到隱藏層和隱藏層到輸出層的權(quán)重矩陣
w1=tf.Variable(tf.random_normal([2,2]))
w2=tf.Variable(tf.random_normal([2,1]))
 
#定義b1和b2，分別為隱藏層和輸出層的偏移量
b1=tf.Variable([0.1,0.1])
b2=tf.Variable([0.1])
 
#使用Relu激活函數(shù)得到隱藏層的輸出值
a=tf.nn.relu(tf.matmul(x,w1)+b1)
 
#輸出層不用激活函數(shù)，直接獲得其值
out=tf.matmul(a,w2)+b2
 
#定義損失函數(shù)MSE
loss=tf.reduce_mean(tf.square(out-y))
 
#優(yōu)化器選擇Adam
train=tf.train.AdamOptimizer(0.01).minimize(loss)
 
#開始訓(xùn)練，迭代1001次(方便后邊的整數(shù)步數(shù)顯示)
with tf.Session() as session:
  session.run(tf.global_variables_initializer()) #初始化變量
  for i in range(1001):
    session.run(train,feed_dict={x:X,y:Y}) #訓(xùn)練模型
    loss_final=session.run(loss,feed_dict={x:X,y:Y}) #獲取損失
    if i%100==0:
      print("step:%d   loss:%2f" % (i,loss_final))
  print("X: %r" % X)
  print("pred_out: %r" % session.run(out,feed_dict={x:X}))

對(duì)照第三張圖片理解代碼更加直觀，我們的隱藏層神經(jīng)元功能就是將輸入值和相應(yīng)權(quán)重做矩陣乘法，然后加上偏移量，最后使用激活函數(shù)進(jìn)行非線性轉(zhuǎn)換;而輸出層沒有用到激活函數(shù)，因?yàn)楸敬挝覀儾皇沁M(jìn)行分類或者其他操作，一般情況下隱藏層使用激活函數(shù)Relu，輸出層若是分類則用sigmode，當(dāng)然你也可以不用，本次實(shí)驗(yàn)只是單純地做異或運(yùn)算，那輸出層就不勞駕激活函數(shù)了～

對(duì)于標(biāo)準(zhǔn)神經(jīng)元內(nèi)部的操作可理解為下圖：