Tensorflow 實現(xiàn)線性回歸模型的示例代碼
1.線性與非線性回歸
線性回歸 Linear Regression:兩個變量之間的關系是一次函數(shù)關系的——圖像是直線,叫做線性。線性是指廣義的線性,也就是數(shù)據(jù)與數(shù)據(jù)之間的關系,如圖x1。
非線性回歸:兩個變量之間的關系不是一次函數(shù)關系的——圖像不是直線,叫做非線性,如圖x2。
一元線性回歸:只包括一個自變量和一個因變量,且二者的關系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。函數(shù)表達: y=bx+a。
多元線性回歸:包括兩個或兩個以上相互獨立的自變量(x1,x2,x3...),且因變量(y)和自變量之間是線性關系,則稱為多元線性回歸分析。函數(shù)表達:
線性回歸在深度學習中的應用: 在深度學習中,我們就是要根據(jù)已知數(shù)據(jù)點(自變量)和因變量(y)去訓練模型得到未知參數(shù)a和b、 和的具體值,從而得到預測模型,在這里()相當于深度學習中目標對象的特征,(y)相當于具體的目標對象。得到預測模型之后再對未知的自變量x進行預測,得到預測的y。
線性回歸問題與分類問題:與回歸相對的是分類問題(classification),分類問題預測輸出的y值是有限的,預測值y只能是有限集合內(nèi)的一個。而當要預測值y輸出集合是無限且連續(xù),我們稱之為回歸。比如,天氣預報預測明天是否下雨,是一個二分類問題;預測明天的降雨量多少,就是一個回歸問題。
案例講解
了解基礎概念之后,使用Tensorflow實現(xiàn)一個簡單的一元線性回歸問題, 調(diào)查學歷和收入之間的線性關系,如下所示:
求解未知參數(shù)a和b的方法:
1.數(shù)據(jù)集
模型訓練的數(shù)據(jù)存儲在一個.csv文件里,Education代表學歷【自變量x】,Income代表收入【因變量y】。
目標:我們要利用已知的Education和income數(shù)據(jù)值,求解未知參數(shù)a和b的值,得到Education和Income之間的線性關系。
2.讀取訓練數(shù)據(jù)Income.csv并可視化展示
import tensorflow as tf import numpy as np # 1.查看tensorflow版本 print("Tensorflow Version{}".format(tf.__version__)) # 2.pandas讀取包含線性關系的.csv文件 import pandas as pd data = pd.read_csv('D:\Project\TesorFlow\datasets\Income.csv') print(data) # 3.繪制線性回歸關系-散點圖 import matplotlib.pyplot as plt plt.scatter(data.Education,data.Income) plt.show()
3.利用Tensorflow搭建和訓練神經(jīng)網(wǎng)絡模型【線性回歸模型的建立】
# 4.順序模型squential的建立 # 順序模型是指網(wǎng)絡是一層一層搭建的,前面一層的輸出是后一層的輸入。 model = tf.keras.Sequential() model.add(tf.keras.layers.Dense(1,input_shape=(1,))) # dense(輸出數(shù)據(jù)的維度,輸入數(shù)據(jù)的維度) # 5.查看模型的結(jié)構(gòu) model.summary() # 6.編譯模型 - 配置的過程, 優(yōu)化算法方式(梯度下降)、損失函數(shù) # Adam優(yōu)化器的學習速率默認為0.01 model.compile(optimizer='adam', loss = 'mse') # 7.訓練模型,記錄模型的訓練過程 history # 訓練過程是loss函數(shù)值降低的過程: # 即不斷逼近最優(yōu)的a和b參數(shù)值的過程 # 這個過程要訓練很多次epoch,epoch是指對所有訓練數(shù)據(jù)訓練的次數(shù) history = model.fit(x,y,epochs=100)
model.summary(): 查看我們創(chuàng)建的神經(jīng)網(wǎng)絡模型,這里我們只添加了一層全連接層。
訓練過程:這里只訓練100個epoch.
4. 模型預測
# 8.已知數(shù)據(jù)預測 model.predict(x) print(model.predict(x)) # 9.隨機數(shù)據(jù)預測: # """ # 注意:pandas數(shù)據(jù)結(jié)構(gòu)是數(shù)據(jù)框DataFrame和 序列 Series # 序列(Series)是二維表格中的一列或者一行。實際上,當訪問DataFrame的一行時,pandas自動把該行轉(zhuǎn)換為序列;當訪問DataFrame的一列時,Pandas也自動把該列轉(zhuǎn)換為序列。 # 序列是由一組數(shù)據(jù)(各種NumPy數(shù)據(jù)類型),以及一組與之相關的數(shù)據(jù)標簽(索引)組成,序列不要求數(shù)據(jù)類型是相同的,序列可以看作是一維數(shù)組(一行或一列) # 序列的表現(xiàn)形式為:索引在左邊,值在右邊。由于沒有顯式為Series指定索引,pandas會自動創(chuàng)建一個從0到N-1的整數(shù)型索引。 # """ # test_predict = model.predict(pd.Series([20])) # 所以這里輸入時需要將其轉(zhuǎn)換為Series結(jié)構(gòu) test_predict = model.predict(pd.Series([10,20])) # 預測的數(shù)據(jù)為10和20 print(test_predict) print(pd.DataFrame([(10,20,30)]))
已知結(jié)果的數(shù)據(jù)預測的結(jié)果: 查看我們創(chuàng)建的神經(jīng)網(wǎng)絡模型,這里我們只添加了一層全連接層。
未知結(jié)果的數(shù)據(jù)預測的結(jié)果: 可以看到預測結(jié)果很差,說明我們的神經(jīng)網(wǎng)絡模型并沒有訓練好,求解得到的未知參數(shù)的a和b的值很差。
解決辦法:: 加深神經(jīng)網(wǎng)絡模型的參數(shù),訓練更多的次數(shù)epoch或者添加實驗數(shù)據(jù)。
sklearn庫有寫好了的線性回歸函數(shù),from sklearn.linear_model import LinearRegression直接導入即可。
到此這篇關于Tensorflow 實現(xiàn)線性回歸模型的示例代碼的文章就介紹到這了,更多相關Tensorflow 線性回歸模型內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
解決使用pip安裝報錯:Microsoft?Visual?C++?14.0?is?required.
對于程序員來說,經(jīng)常pip安裝自己所需要的包,大部分的包基本都能安裝,但是總會遇到包安裝不了的問題,下面這篇文章主要給大家介紹了關于如何解決使用pip安裝報錯:Microsoft?Visual?C++?14.0?is?required.的相關資料,需要的朋友可以參考下2022-09-09python 使用socket傳輸圖片視頻等文件的實現(xiàn)方式
這篇文章主要介紹了python 使用socket傳輸圖片視頻等文件的實現(xiàn)方式,本文給出了實例代碼,需要的朋友可以參考下2019-08-08python之PyQt按鈕右鍵菜單功能的實現(xiàn)代碼
這篇文章主要介紹了python PyQt按鈕右鍵菜單功能的實現(xiàn)代碼,代碼簡單易懂,非常不錯,具有一定的參考借鑒價值,需要的朋友可以參考下2019-08-08Python實現(xiàn)批量生成,重命名和刪除word文件
這篇文章主要為大家詳細介紹了Python如何利用第三方庫實現(xiàn)批量生成、重命名和刪除word文件的功能,文中的示例代碼講解詳細,需要的可以參考一下2023-03-03Django 響應數(shù)據(jù)response的返回源碼詳解
這篇文章主要介紹了Django 響應數(shù)據(jù)response的返回源碼詳解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下2019-08-08