快捷導(dǎo)航

Tensorflow 實(shí)現(xiàn)線性回歸模型的示例代碼

更新時(shí)間：2022年05月16日 09:40:07 作者：碼農(nóng)的后花園

這篇文章主要介紹了Tensorflow 實(shí)現(xiàn)線性回歸模型，文中通過示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

1.線性與非線性回歸

線性回歸 Linear Regression：兩個(gè)變量之間的關(guān)系是一次函數(shù)關(guān)系的——圖像是直線，叫做線性。線性是指廣義的線性，也就是數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系,如圖x1。

非線性回歸：兩個(gè)變量之間的關(guān)系不是一次函數(shù)關(guān)系的——圖像不是直線，叫做非線性，如圖x2。

一元線性回歸:只包括一個(gè)自變量和一個(gè)因變量，且二者的關(guān)系可用一條直線近似表示，這種回歸分析稱為一元線性回歸分析。函數(shù)表達(dá): y=bx+a。

多元線性回歸：包括兩個(gè)或兩個(gè)以上相互獨(dú)立的自變量(x1,x2,x3...)，且因變量(y)和自變量之間是線性關(guān)系，則稱為多元線性回歸分析。函數(shù)表達(dá):

線性回歸在深度學(xué)習(xí)中的應(yīng)用: 在深度學(xué)習(xí)中，我們就是要根據(jù)已知數(shù)據(jù)點(diǎn)(自變量)和因變量(y)去訓(xùn)練模型得到未知參數(shù)a和b、和的具體值,從而得到預(yù)測(cè)模型，在這里()相當(dāng)于深度學(xué)習(xí)中目標(biāo)對(duì)象的特征，(y)相當(dāng)于具體的目標(biāo)對(duì)象。得到預(yù)測(cè)模型之后再對(duì)未知的自變量x進(jìn)行預(yù)測(cè),得到預(yù)測(cè)的y。

線性回歸問題與分類問題：與回歸相對(duì)的是分類問題(classification)，分類問題預(yù)測(cè)輸出的y值是有限的，預(yù)測(cè)值y只能是有限集合內(nèi)的一個(gè)。而當(dāng)要預(yù)測(cè)值y輸出集合是無(wú)限且連續(xù)，我們稱之為回歸。比如，天氣預(yù)報(bào)預(yù)測(cè)明天是否下雨，是一個(gè)二分類問題；預(yù)測(cè)明天的降雨量多少，就是一個(gè)回歸問題。

案例講解

了解基礎(chǔ)概念之后，使用Tensorflow實(shí)現(xiàn)一個(gè)簡(jiǎn)單的一元線性回歸問題, 調(diào)查學(xué)歷和收入之間的線性關(guān)系,如下所示:

求解未知參數(shù)a和b的方法：

1.數(shù)據(jù)集

模型訓(xùn)練的數(shù)據(jù)存儲(chǔ)在一個(gè).csv文件里，Education代表學(xué)歷【自變量x】，Income代表收入【因變量y】。

目標(biāo):我們要利用已知的Education和income數(shù)據(jù)值，求解未知參數(shù)a和b的值,得到Education和Income之間的線性關(guān)系。

2.讀取訓(xùn)練數(shù)據(jù)Income.csv并可視化展示

import tensorflow as tf
import numpy as np
# 1.查看tensorflow版本
print("Tensorflow Version{}".format(tf.__version__))
 
# 2.pandas讀取包含線性關(guān)系的.csv文件
import pandas as pd
data = pd.read_csv('D:\Project\TesorFlow\datasets\Income.csv')
print(data)
 
# 3.繪制線性回歸關(guān)系-散點(diǎn)圖
import matplotlib.pyplot as plt
plt.scatter(data.Education,data.Income)
plt.show()

3.利用Tensorflow搭建和訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型【線性回歸模型的建立】

# 4.順序模型squential的建立
# 順序模型是指網(wǎng)絡(luò)是一層一層搭建的，前面一層的輸出是后一層的輸入。
model = tf.keras.Sequential()
model.add(tf.keras.layers.Dense(1,input_shape=(1,)))
# dense(輸出數(shù)據(jù)的維度，輸入數(shù)據(jù)的維度)
 
# 5.查看模型的結(jié)構(gòu)
model.summary()
 
# 6.編譯模型 - 配置的過程, 優(yōu)化算法方式（梯度下降）、損失函數(shù)
# Adam優(yōu)化器的學(xué)習(xí)速率默認(rèn)為0.01
model.compile(optimizer='adam',
              loss = 'mse')
 
# 7.訓(xùn)練模型,記錄模型的訓(xùn)練過程 history
# 訓(xùn)練過程是loss函數(shù)值降低的過程:
# 即不斷逼近最優(yōu)的a和b參數(shù)值的過程
# 這個(gè)過程要訓(xùn)練很多次epoch,epoch是指對(duì)所有訓(xùn)練數(shù)據(jù)訓(xùn)練的次數(shù)
history = model.fit(x,y,epochs=100)

model.summary(): 查看我們創(chuàng)建的神經(jīng)網(wǎng)絡(luò)模型,這里我們只添加了一層全連接層。

訓(xùn)練過程:這里只訓(xùn)練100個(gè)epoch.

4. 模型預(yù)測(cè)

# 8.已知數(shù)據(jù)預(yù)測(cè)
model.predict(x)
print(model.predict(x))
 
# 9.隨機(jī)數(shù)據(jù)預(yù)測(cè): 
# """
# 注意：pandas數(shù)據(jù)結(jié)構(gòu)是數(shù)據(jù)框DataFrame和 序列 Series
# 序列（Series）是二維表格中的一列或者一行。實(shí)際上，當(dāng)訪問DataFrame的一行時(shí)，pandas自動(dòng)把該行轉(zhuǎn)換為序列；當(dāng)訪問DataFrame的一列時(shí)，Pandas也自動(dòng)把該列轉(zhuǎn)換為序列。
# 序列是由一組數(shù)據(jù)（各種NumPy數(shù)據(jù)類型），以及一組與之相關(guān)的數(shù)據(jù)標(biāo)簽（索引）組成，序列不要求數(shù)據(jù)類型是相同的,序列可以看作是一維數(shù)組(一行或一列)
# 序列的表現(xiàn)形式為：索引在左邊，值在右邊。由于沒有顯式為Series指定索引，pandas會(huì)自動(dòng)創(chuàng)建一個(gè)從0到N-1的整數(shù)型索引。
# """
# test_predict = model.predict(pd.Series([20]))  # 所以這里輸入時(shí)需要將其轉(zhuǎn)換為Series結(jié)構(gòu)
test_predict = model.predict(pd.Series([10,20]))  # 預(yù)測(cè)的數(shù)據(jù)為10和20
print(test_predict)
print(pd.DataFrame([(10,20,30)]))

已知結(jié)果的數(shù)據(jù)預(yù)測(cè)的結(jié)果: 查看我們創(chuàng)建的神經(jīng)網(wǎng)絡(luò)模型,這里我們只添加了一層全連接層。