python用線性回歸預測股票價格的實現(xiàn)代碼

更新時間：2019年09月04日 14:48:37 作者：qq_19600291

這篇文章主要介紹了python用線性回歸預測股票價格的實現(xiàn)代碼，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧

線性回歸在整個財務中廣泛應用于眾多應用程序中。在之前的教程中，我們使用普通最小二乘法（OLS）計算了公司的beta與相對索引的比較?，F(xiàn)在，我們將使用線性回歸來估計股票價格。

線性回歸是一種用于模擬因變量（y）和自變量（x）之間關系的方法。通過簡單的線性回歸，只有一個自變量x。可能有許多獨立變量屬于多元線性回歸的范疇。在這種情況下，我們只有一個自變量即日期。對于第一個日期上升到日期向量長度的整數(shù)，該日期將由1開始的整數(shù)表示，該日期可以根據(jù)時間序列數(shù)據(jù)而變化。當然，我們的因變量將是股票的價格。為了理解線性回歸，您必須了解您可能在學校早期學到的相當基本的等式。

y = a + bx

Y =預測值或因變量
b =線的斜率
x =系數(shù)或自變量
a = y截距

從本質上講，這將構成我們對數(shù)據(jù)的最佳擬合。在OLS過程中通過數(shù)據(jù)集繪制了大量線條。該過程的目標是找到最佳擬合線，最小化平方誤差和（SSE）與股票價格（y）的實際值以及我們在數(shù)據(jù)集中所有點的預測股票價格。這由下圖表示。對于繪制的每條線，數(shù)據(jù)集中的每個點與模型輸出的相應預測值之間存在差異。將這些差異中的每一個加起來并平方以產生平方和。從列表中，我們采用最小值導致我們的最佳匹配線?？紤]下圖：

第一部分：獲取數(shù)據(jù)：

from matplotlib import style
 
from sklearn.linear_model import LinearRegression
 
from sklearn.model_selection import train_test_split
 
import quandl
 
import datetime
 
style.use('ggplot')
 
#Dates
 
start_date = datetime.date(2017,1,3)
 
t_date=start_date, end_date=end_date, collapse="daily")
 
df = df.reset_index()
 
prices = np.reshape(prices, (len(prices), 1))

第二部分：創(chuàng)建一個回歸對象：

', linewidth=3, label = 'Predicted Price') #plotting the line made by linear regression
 
plt.title('Linear Regression | Time vs. Price')
 
plt.legend()
 
predicted_price =regressor.predict(date)

輸出：

預測日期輸入價格：

創(chuàng)建訓練/測試集

et
 
xtrain, x , ytrain)
 
#Train
 
plt.title('Linear Regression | Time vs. Price')
 
#Test Set Graph
 
plt.scatter(xtest, ytest, color='yellow', label= 'Actual Price') #plotting the initial datapoints
 
plt.plot(xtest, regressor.predict(xtest), color='blue', linewidth=3, label = 'Predicted Price') #plotting
 
plt.show()

輸出：