欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

關(guān)于多元線性回歸分析——Python&SPSS

 更新時(shí)間:2020年02月24日 10:51:33   作者:zpxcod007  
今天小編就為大家分享一篇關(guān)于多元線性回歸分析——Python&SPSS,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧

原始數(shù)據(jù)在這里

1.觀察數(shù)據(jù)

首先,用Pandas打開(kāi)數(shù)據(jù),并進(jìn)行觀察。

import numpy 
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
 
data = pd.read_csv('Folds5x2_pp.csv')
data.head() 

會(huì)看到數(shù)據(jù)如下所示:

這份數(shù)據(jù)代表了一個(gè)循環(huán)發(fā)電廠,每個(gè)數(shù)據(jù)有5列,分別是:AT(溫度), V(壓力), AP(濕度), RH(壓強(qiáng)), PE(輸出電力)。我們不用糾結(jié)于每項(xiàng)具體的意思。

我們的問(wèn)題是得到一個(gè)線性的關(guān)系,對(duì)應(yīng)PE是樣本輸出,而AT/V/AP/RH這4個(gè)是樣本特征, 機(jī)器學(xué)習(xí)的目的就是得到一個(gè)線性回歸模型,即: PE=θ0+θ1∗AT+θ2∗V+θ3∗AP+θ4∗RH 而需要學(xué)習(xí)的,就是θ0,θ1,θ2,θ3,θ4這5個(gè)參數(shù)。

接下來(lái)對(duì)數(shù)據(jù)進(jìn)行歸一化處理:

data = (data - data.mean())/data.std()

因?yàn)榛貧w線的截距θ0是不受樣本特征影響的,因此我們?cè)诖丝梢栽O(shè)立一個(gè)X0=1,使得回歸模型為:

PE=θ0*X0+θ1∗AT+θ2∗V+θ3∗AP+θ4∗RH

將方程向量化可得:

PE = hθ(x) = θx (θ應(yīng)轉(zhuǎn)置)

2.線性回歸

在線性回歸中,首先應(yīng)建立 cost function,當(dāng) cost function 的值最小時(shí)所取得θ值為所求的θ。

在線性回歸中,Cost function如下所示:

因此,可以在Python中建立函數(shù)求損失方程:

def CostFunction(X,y,theta):
  inner = np.power((X*theta.T)-y,2)
  return np.sum(inner)/(2*len(X))

然后,設(shè)初始θ為=[0,0,0,0,0],可得到最初的J(θ)值為0.49994774247491858,代碼如下所示

col = data.shape[1]
X = data.iloc[:,0:col-1]
y = data.iloc[:,col-1:col]
X = np.matrix(X.values)
y = np.matrix(y.values)
theta = np.matrix(np.array([0,0,0,0,0]))
temp = np.matrix(np.zeros(theta.shape))
CostFunction(X,y,theta)

接下來(lái),有兩種方法可以使用。1.梯度下降法(gradient descent)和 2.最小二乘法(normal equation)。在此我們使用梯度下降法來(lái)求解。

梯度下降法是求得J對(duì)θ的偏導(dǎo)數(shù),通過(guò)設(shè)置步長(zhǎng),迭代使J(θ)逐步下降,從而求得局部最優(yōu)解。

公式如下所示:

j:特征編號(hào)

m:樣本編號(hào)

我們可以在Python中寫出計(jì)算迭代后的θ和J(θ)

def gradientDescent(X,y,theta,alpha,iters):
  temp = np.matrix(np.zeros(theta.shape))
  parameters = int(theta.ravel().shape[1])
  cost = np.zeros(iters)
  for i in range(iters):
    error = (X*theta.T)-y
    
    for j in range(parameters):
      term = np.multiply(error,X[:,j])
      temp[0,j] = theta[0,j] - (alpha/len(X))*np.sum(term)
      
    theta = temp
    cost[i] = CostFunction(X,y,theta)
    
  return theta,cost

在此,我設(shè)置初始的α為0.1,可求得迭代1000次后θ0,θ1,θ2,θ3,θ4的值分別是:

-5.22080706e-14,-8.63485491e-01,-1.74182863e-01,2.16058120e-02,-1.35205248e-01

此時(shí) J(θ)的值為0.0379648。

通過(guò),可視化J(θ)和迭代次數(shù)可以發(fā)現(xiàn),J(θ)收斂的非??臁?/p>

畫圖觀察預(yù)測(cè)值和損失值,距離直線約近說(shuō)明損失越?。?/p>

predicted = X*g.T
predicted = predicted.flatten().A[0]
y_f= y.flatten().A[0]
fig, ax = plt.subplots()
ax.scatter(y_f,predicted)
ax.plot([y.min(), y.max()], [y.min(), y.max()], 'k--', lw=4)
ax.set_xlabel('Measured')
ax.set_ylabel('Predicted')
plt.show()

3.sckit-learn

因?yàn)镴(θ)收斂的太快了…所以我又用sckit-learn和SPSS驗(yàn)證了一下。

先看sckit-learn,在sklearn中,線性回歸是使用的最小二乘法而不是梯度下降法,用起來(lái)也十分的簡(jiǎn)單。

代碼如下:

from sklearn import linear_model 
model = linear_model.LinearRegression() 
model.fit(X, y) 

打印出θ值后發(fā)現(xiàn)和梯度下降法算出來(lái)的相差無(wú)幾,θ0,θ1,θ2,θ3,θ4的值分別是:

0,-0.86350078,-0.17417154,0.02160293,-0.13521023

4.SPSS

在看看SPSS

同樣先將數(shù)據(jù)標(biāo)準(zhǔn)化后進(jìn)行線

然后進(jìn)行線性回歸分析得到結(jié)果:

嘛…和前面兩種方法的結(jié)果也差不多…就這樣吧。

以上這篇關(guān)于多元線性回歸分析——Python&SPSS就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • 淺析Python數(shù)字類型和字符串類型的內(nèi)置方法

    淺析Python數(shù)字類型和字符串類型的內(nèi)置方法

    這篇文章主要介紹了Python數(shù)字類型和字符串類型的內(nèi)置方法,本文通過(guò)實(shí)例代碼講解的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2019-12-12
  • Python圖像處理庫(kù)PIL的ImageFont模塊使用介紹

    Python圖像處理庫(kù)PIL的ImageFont模塊使用介紹

    這篇文章主要介紹了Python圖像處理庫(kù)PIL的ImageFont模塊使用介紹,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2020-02-02
  • Python測(cè)試網(wǎng)絡(luò)連通性示例【基于ping】

    Python測(cè)試網(wǎng)絡(luò)連通性示例【基于ping】

    這篇文章主要介紹了Python測(cè)試網(wǎng)絡(luò)連通性,結(jié)合實(shí)例形式分析了Python通過(guò)發(fā)送ping請(qǐng)求測(cè)試網(wǎng)絡(luò)連通性相關(guān)操作技巧,需要的朋友可以參考下
    2018-08-08
  • python繪圖中的?四個(gè)繪圖技巧

    python繪圖中的?四個(gè)繪圖技巧

    在可視化數(shù)據(jù)時(shí),通常需要在單個(gè)圖形中繪制多個(gè)圖形。?例如,如果您想從不同的角度可視化相同的變量如:數(shù)字變量的并排直方圖和箱線圖,則多個(gè)圖形很有用。?在這篇文章中,我分享了繪制多個(gè)圖形的?4?個(gè)簡(jiǎn)單但實(shí)用的技巧,具有一定的參考價(jià)值,需要的小伙伴可以參考一下
    2021-12-12
  • python如何獲取網(wǎng)絡(luò)數(shù)據(jù)

    python如何獲取網(wǎng)絡(luò)數(shù)據(jù)

    這篇文章主要介紹了python如何獲取網(wǎng)絡(luò)數(shù)據(jù),幫助大家更好的理解和學(xué)習(xí)使用python,感興趣的朋友可以了解下
    2021-04-04
  • Python pathlib模塊實(shí)例詳解

    Python pathlib模塊實(shí)例詳解

    本文給大家介紹了Python的pathlib 模塊,為 Python 工程師對(duì)該模塊的使用提供了支撐,讓大家了解如何使用 pathlib 模塊讀寫文件、操縱文件路徑和基礎(chǔ)文件系統(tǒng),統(tǒng)計(jì)目錄下的文件類型以及查找匹配目錄下某一類型文件等,需要的朋友參考下吧
    2023-05-05
  • Python中的OpenCV圖像腐蝕處理和膨脹處理

    Python中的OpenCV圖像腐蝕處理和膨脹處理

    這篇文章主要介紹了Python中的OpenCV圖像腐蝕處理和膨脹處理,OpenCV是一個(gè)跨平臺(tái)的計(jì)算機(jī)視覺(jué)庫(kù),可用于開(kāi)發(fā)實(shí)時(shí)的圖像處理、計(jì)算機(jī)視覺(jué)以及模式識(shí)別程序,需要的朋友可以參考下
    2023-08-08
  • python 列表,數(shù)組,矩陣兩兩轉(zhuǎn)換tolist()的實(shí)例

    python 列表,數(shù)組,矩陣兩兩轉(zhuǎn)換tolist()的實(shí)例

    下面小編就為大家分享一篇python 列表,數(shù)組,矩陣兩兩轉(zhuǎn)換tolist()的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2018-04-04
  • Python中type的構(gòu)造函數(shù)參數(shù)含義說(shuō)明

    Python中type的構(gòu)造函數(shù)參數(shù)含義說(shuō)明

    這篇文章主要介紹了Python中type的構(gòu)造函數(shù)參數(shù)含義說(shuō)明,本文用一個(gè)編碼實(shí)例解釋Python type的參數(shù)的作用和含義,需要的朋友可以參考下
    2015-06-06
  • python虛擬環(huán)境virualenv的安裝與使用

    python虛擬環(huán)境virualenv的安裝與使用

    virtualenv 是一個(gè)創(chuàng)建隔絕的Python環(huán)境的工具。virtualenv創(chuàng)建一個(gè)包含所有必要的可執(zhí)行文件的文件夾,用來(lái)使用Python工程所需的包。下面這篇文章就給大家介紹了python虛擬環(huán)境virualenv的安裝與使用,有需要的朋友們可以參考借鑒,下面來(lái)一起看看吧。
    2016-12-12

最新評(píng)論