Python多項式回歸的實現(xiàn)方法
多項式回歸是一種線性回歸形式,其中自變量x和因變量y之間的關系被建模為n次多項式。多項式回歸擬合x的值與y的相應條件均值之間的非線性關系,表示為E(y | x)
為什么多項式回歸:
- 研究人員假設的某些關系是曲線的。顯然,這種類型的案例將包括多項式項。
- 檢查殘差。如果我們嘗試將線性模型擬合到曲線數(shù)據(jù),則預測變量(X軸)上的殘差(Y軸)的散點圖將在中間具有許多正殘差的斑塊。因此,在這種情況下,這是不合適的。
- 通常的多元線性回歸分析的假設是所有自變量都是獨立的。在多項式回歸模型中,不滿足該假設。
多項式回歸的使用:
這些基本上用于定義或描述非線性現(xiàn)象,例如:
- 組織生長速度。
- 疾病流行病的進展
- 湖泊沉積物中碳同位素的分布
回歸分析的基本目標是根據(jù)自變量x的值來模擬因變量y的期望值。在簡單回歸中,我們使用以下等式 y = a + bx + e
這里y是因變量,a是y截距,b是斜率,e是誤差率。
在許多情況下,這種線性模型將無法解決。例如,如果我們在這種情況下根據(jù)合成溫度分析化學合成的產(chǎn)生,我們使用二次模型y = a + b1x + b2 ^ 2 + e
這里y是x的因變量,a是y截距,e是誤差率。
通常,我們可以將其建模為第n個值。y = a + b1x + b2x ^ 2 + .... + bnx ^ n
由于回歸函數(shù)在未知變量方面是線性的,因此這些模型從估計的角度來看是線性的。
因此,通過最小二乘技術,讓我們計算y的響應值。
Python中的多項式回歸:
要獲得用于分析多項式回歸的數(shù)據(jù)集,請單擊此處。
步驟1:導入庫和數(shù)據(jù)集
導入重要的庫和我們用于執(zhí)行多項式回歸的數(shù)據(jù)集。
# Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd # Importing the dataset datas = pd.read_csv('data.csv') datas
第2步:將數(shù)據(jù)集分為2個組件
將數(shù)據(jù)集劃分為兩個組件,即X和yX將包含1到2之間的列.y將包含2列。
X = datas.iloc[:, 1:2].values y = datas.iloc[:, 2].values
第3步:將線性回歸擬合到數(shù)據(jù)集
擬合線性回歸模型在兩個組件上。
# Fitting Linear Regression to the dataset from sklearn.linear_model import LinearRegression lin = LinearRegression() lin.fit(X, y)
第4步:將多項式回歸擬合到數(shù)據(jù)集
將多項式回歸模型擬合到兩個分量X和y上。
# Fitting Polynomial Regression to the dataset from sklearn.preprocessing import PolynomialFeatures poly = PolynomialFeatures(degree = 4) X_poly = poly.fit_transform(X) poly.fit(X_poly, y) lin2 = LinearRegression() lin2.fit(X_poly, y)
步驟5:在此步驟中,我們使用散點圖可視化線性回歸結果。
# Visualising the Linear Regression results plt.scatter(X, y, color = 'blue') plt.plot(X, lin.predict(X), color = 'red') plt.title('Linear Regression') plt.xlabel('Temperature') plt.ylabel('Pressure') plt.show()
步驟6:使用散點圖可視化多項式回歸結果。
# Visualising the Polynomial Regression results plt.scatter(X, y, color = 'blue') plt.plot(X, lin2.predict(poly.fit_transform(X)), color = 'red') plt.title('Polynomial Regression') plt.xlabel('Temperature') plt.ylabel('Pressure') plt.show()
步驟7:使用線性和多項式回歸預測新結果。
# Predicting a new result with Linear Regression lin.predict(110.0)
# Predicting a new result with Polynomial Regression lin2.predict(poly.fit_transform(110.0))
使用多項式回歸的優(yōu)點:
- 廣泛的功能可以適應它。
- 多項式基本上適合寬范圍的曲率。
- 多項式提供了依賴變量和自變量之間關系的最佳近似。
使用多項式回歸的缺點
- 這些對異常值過于敏感。
- 數(shù)據(jù)中存在一個或兩個異常值會嚴重影響非線性分析的結果。
- 此外,遺憾的是,用于檢測非線性回歸中的異常值的模型驗證工具少于線性回歸。
以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
相關文章
Python爬取奶茶店數(shù)據(jù)分析哪家最好喝以及性價比
這篇文章主要介紹了用Python告訴你奶茶哪家最好喝性價比最高,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習吧2022-09-09Python基礎第三方模塊requests openpyxl
這篇文章主要為大家介紹了Python基礎第三方模塊requests openpyxl使用示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2022-11-11Python開源自動化工具Playwright安裝及介紹使用
playwright-python是一個強大的Python庫,僅用一個API即可自動執(zhí)行Chromium、Firefox、WebKit等主流瀏覽器自動化操作,本文就詳細的介紹一下如何使用,感興趣的可以了解一下2021-12-12pytest使用parametrize將參數(shù)化變量傳遞到fixture
這篇文章主要為大家介紹了pytest使用parametrize將參數(shù)化變量傳遞到fixture的使用詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2022-05-05python數(shù)據(jù)處理和數(shù)據(jù)清洗的示例詳解
數(shù)據(jù)清洗是指發(fā)現(xiàn)并糾正數(shù)據(jù)文件中可識別的錯誤的最后一道程序,包括檢查數(shù)據(jù)一致性,處理無效值和缺失值等,數(shù)據(jù)清洗與處理的目的是提高數(shù)據(jù)的質(zhì)量,提高實驗結果的可靠度,本文給大家介紹了python數(shù)據(jù)處理和數(shù)據(jù)清洗的示例,需要的朋友可以參考下2024-08-08tensorflow轉(zhuǎn)onnx的實現(xiàn)方法
本文主要介紹了tensorflow轉(zhuǎn)onnx的實現(xiàn)方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2023-03-03