欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python集成學(xué)習(xí)之Blending算法詳解

 更新時(shí)間:2021年05月13日 11:33:57   作者:GoAl的博客  
集成學(xué)習(xí)(又稱模型融合)就是結(jié)合若干個(gè)體分類器(基學(xué)習(xí)器)進(jìn)行綜合預(yù)測(cè),各個(gè)個(gè)體學(xué)習(xí)器通常是弱學(xué)習(xí)器.集成學(xué)習(xí)相較于個(gè)體學(xué)習(xí)在預(yù)測(cè)準(zhǔn)確率以及穩(wěn)定性上都有很大的提高.文中有非常詳細(xì)的代碼示例哦,需要的朋友可以參考下

一、前言

普通機(jī)器學(xué)習(xí):從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)一個(gè)假設(shè)。

集成方法:試圖構(gòu)建一組假設(shè)并將它們組合起來(lái),集成學(xué)習(xí)是一種機(jī)器學(xué)習(xí)范式,多個(gè)學(xué)習(xí)器被訓(xùn)練來(lái)解決同一個(gè)問(wèn)題。

集成方法分類為:

Bagging(并行訓(xùn)練):隨機(jī)森林

Boosting(串行訓(xùn)練):Adaboost; GBDT; XgBoost

Stacking:

Blending:

或者分類為串行集成方法和并行集成方法

1.串行模型:通過(guò)基礎(chǔ)模型之間的依賴,給錯(cuò)誤分類樣本一個(gè)較大的權(quán)重來(lái)提升模型的性能。

2.并行模型的原理:利用基礎(chǔ)模型的獨(dú)立性,然后通過(guò)平均能夠較大地降低誤差

二、Blending介紹

訓(xùn)練數(shù)據(jù)劃分為訓(xùn)練和驗(yàn)證集+新的訓(xùn)練數(shù)據(jù)集和新的測(cè)試集

將訓(xùn)練數(shù)據(jù)進(jìn)行劃分,劃分之后的訓(xùn)練數(shù)據(jù)一部分訓(xùn)練基模型,一部分經(jīng)模型預(yù)測(cè)后作為新的特征訓(xùn)練元模型。
測(cè)試數(shù)據(jù)同樣經(jīng)過(guò)基模型預(yù)測(cè),形成新的測(cè)試數(shù)據(jù)。最后,元模型對(duì)新的測(cè)試數(shù)據(jù)進(jìn)行預(yù)測(cè)。Blending框架圖如下所示:
注意:其是在stacking的基礎(chǔ)上加了劃分?jǐn)?shù)據(jù)

三、Blending流程圖

在這里插入圖片描述

  • 第一步:將原始訓(xùn)練數(shù)據(jù)劃分為訓(xùn)練集和驗(yàn)證集。
  • 第二步:使用訓(xùn)練集對(duì)訓(xùn)練T個(gè)不同的模型。
  • 第三步:使用T個(gè)基模型,對(duì)驗(yàn)證集進(jìn)行預(yù)測(cè),結(jié)果作為新的訓(xùn)練數(shù)據(jù)。
  • 第四步:使用新的訓(xùn)練數(shù)據(jù),訓(xùn)練一個(gè)元模型。
  • 第五步:使用T個(gè)基模型,對(duì)測(cè)試數(shù)據(jù)進(jìn)行預(yù)測(cè),結(jié)果作為新的測(cè)試數(shù)據(jù)。
  • 第六步:使用元模型對(duì)新的測(cè)試數(shù)據(jù)進(jìn)行預(yù)測(cè),得到最終結(jié)果。

在這里插入圖片描述

四、案例

相關(guān)工具包加載

import numpy as np
import pandas as pd 
import matplotlib.pyplot as plt
plt.style.use("ggplot")
%matplotlib inline
import seaborn as sns



創(chuàng)建數(shù)據(jù)

from sklearn import datasets 
from sklearn.datasets import make_blobs
from sklearn.model_selection import train_test_split
data, target = make_blobs(n_samples=10000, centers=2, random_state=1, cluster_std=1.0 )
## 創(chuàng)建訓(xùn)練集和測(cè)試集
X_train1,X_test,y_train1,y_test = train_test_split(data, target, test_size=0.2, random_state=1)
## 創(chuàng)建訓(xùn)練集和驗(yàn)證集
X_train,X_val,y_train,y_val = train_test_split(X_train1, y_train1, test_size=0.3, random_state=1)
print("The shape of training X:",X_train.shape)
print("The shape of training y:",y_train.shape)
print("The shape of test X:",X_test.shape)
print("The shape of test y:",y_test.shape)
print("The shape of validation X:",X_val.shape)
print("The shape of validation y:",y_val.shape)
 

設(shè)置第一層分類器

from sklearn.svm import SVC
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier

clfs = [SVC(probability=True),RandomForestClassifier(n_estimators=5,n_jobs=-1,criterion='gini'),KNeighborsClassifier()]



設(shè)置第二層分類器

from sklearn.linear_model import LinearRegression
lr = LinearRegression()



第一層

val_features = np.zeros((X_val.shape[0],len(clfs)))
test_features = np.zeros((X_test.shape[0],len(clfs)))

for i,clf in enumerate(clfs):
    clf.fit(X_train,y_train)
    val_feature = clf.predict_proba(X_val)[:,1]
    test_feature = clf.predict_proba(X_test)[:,1]
    val_features[:,i] = val_feature
    test_features[:,i] = test_feature



第二層

lr.fit(val_features,y_val)



輸出預(yù)測(cè)的結(jié)果

lr.fit(val_features,y_val)
from sklearn.model_selection import cross_val_score
cross_val_score(lr,test_features,y_test,cv=5)
 

到此這篇關(guān)于Python集成學(xué)習(xí)之Blending算法詳解的文章就介紹到這了,更多相關(guān)Python Blending算法內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python實(shí)現(xiàn)E-Mail收集插件實(shí)例教程

    Python實(shí)現(xiàn)E-Mail收集插件實(shí)例教程

    這篇文章主要給大家介紹了關(guān)于Python實(shí)現(xiàn)E-Mail收集插件的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起看看吧
    2019-02-02
  • Python?OpenCV超詳細(xì)講解讀取圖像視頻和網(wǎng)絡(luò)攝像頭

    Python?OpenCV超詳細(xì)講解讀取圖像視頻和網(wǎng)絡(luò)攝像頭

    OpenCV用C++語(yǔ)言編寫,它具有C?++,Python,Java和MATLAB接口,并支持Windows,Linux,Android和Mac?OS,OpenCV主要傾向于實(shí)時(shí)視覺(jué)應(yīng)用,并在可用時(shí)利用MMX和SSE指令,本篇文章帶你了解OpenCV讀取圖像視頻與網(wǎng)絡(luò)攝像頭的方法
    2022-04-04
  • Python如何通過(guò)手肘法實(shí)現(xiàn)k_means聚類詳解

    Python如何通過(guò)手肘法實(shí)現(xiàn)k_means聚類詳解

    K-means聚類算法是一種常見(jiàn)的無(wú)監(jiān)督學(xué)習(xí)算法,用于將數(shù)據(jù)集分成k個(gè)不同的簇,下面這篇文章主要給大家介紹了關(guān)于Python如何通過(guò)手肘法實(shí)現(xiàn)k_means聚類的相關(guān)資料,需要的朋友可以參考下
    2023-04-04
  • Pandas拼接concat使用方法

    Pandas拼接concat使用方法

    當(dāng)我們需要將兩個(gè)Pandas DataFrame對(duì)象合并為一個(gè)時(shí),就需要使用Pandas拼接函數(shù),本文主要介紹了Pandas拼接concat使用方法,感興趣的可以了解一下
    2023-12-12
  • OpenCV使用KNN完成OCR手寫體識(shí)別

    OpenCV使用KNN完成OCR手寫體識(shí)別

    這篇文章主要為大家介紹了OpenCV使用KNN完成OCR手寫體識(shí)別示例解析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2023-05-05
  • Python中使用插入排序算法的簡(jiǎn)單分析與代碼示例

    Python中使用插入排序算法的簡(jiǎn)單分析與代碼示例

    這篇文章主要介紹了Python使用插入排序算法的簡(jiǎn)單分析與代碼示例,插入算法的平均時(shí)間復(fù)雜度為O(n^2),需要的朋友可以參考下
    2016-05-05
  • Python中表示字符串的三種方法

    Python中表示字符串的三種方法

    這篇文章主要介紹了Python中表示字符串的三種方法的相關(guān)資料,需要的朋友可以參考下
    2017-09-09
  • Python 3.x 新特性及10大變化

    Python 3.x 新特性及10大變化

    這篇文章主要介紹了Python 3.x 新特性及10大變化,本文講解了Python之父Guido van Rossum談到了Python 3.0的構(gòu)思,Python3版本的一些變化如print() and exec() 函數(shù)、整數(shù)及除法、input()代替raw_input()等,需要的朋友可以參考下
    2015-06-06
  • PyCharm中配置PySide2的圖文教程

    PyCharm中配置PySide2的圖文教程

    這篇文章主要介紹了PyCharm中配置PySide2的教程,本文通過(guò)圖文并茂的形式給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-06-06
  • 淺談python3.6的tkinter運(yùn)行問(wèn)題

    淺談python3.6的tkinter運(yùn)行問(wèn)題

    今天小編就為大家分享一篇淺談python3.6的tkinter運(yùn)行問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2019-02-02

最新評(píng)論