對sklearn的使用之?dāng)?shù)據(jù)集的拆分與訓(xùn)練詳解(python3.6)

更新時間：2018年12月14日 14:48:03 作者：子耶

今天小編就為大家分享一篇對sklearn的使用之?dāng)?shù)據(jù)集的拆分與訓(xùn)練詳解(python3.6)，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

研修課上講了兩個例子，融合一下。

主要演示大致的過程：

導(dǎo)入->拆分->訓(xùn)練->模型報告

以及幾個重要問題：

①標簽二值化

②網(wǎng)格搜索法調(diào)參

③k折交叉驗證

④增加噪聲特征（之前涉及）

from sklearn import datasets
#從cross_validation導(dǎo)入會出現(xiàn)warning，說已棄用
from sklearn.model_selection import train-test_split
from sklearn.grid_search import GridSearchCV
from sklearn.metrics import classification_report
from sklearn.svm import SVC
import sklearn.exceptioins
#導(dǎo)入鳶尾花數(shù)據(jù)集
iris = datasets.load_iris()
#將數(shù)據(jù)集拆分為訓(xùn)練集和測試集各一半
#其中X為數(shù)據(jù)特征（花萼、花瓣的高度寬度），為150*4的矩陣
#Y為鳶尾花種類（0, 1, 2三種），為150*1矩陣
#如果使用標簽二值化， 將0, 1, 2表示為100 010 001
#使用y.label_binarize(y, classes[0, 1, 2]),變?yōu)?50*3矩陣
X_train, X_test, y_train, y_test = train_test_split(
iris.data, iris.target, test_size=0.5, random_state=0)
#set the parameters by cross_validation
turn_parameters = [{'kernel' : ['rbf', 'gamma' : [1e-3, 1e - 4, 'C':[1,10,100,1000]}, 
{'kernel':['linear'], 'C':[1,10,100,1000]}
]
#clf分離器
#使用網(wǎng)格搜索法調(diào)超參數(shù)
#訓(xùn)練集做5折交叉驗證
clf = GridSearchCV(SVC(C=1), turned_parameters, cv=5, scoring='%s_weighted' % score)
#用前一半train數(shù)據(jù)再做5折交叉驗證
#因為之前的train_test_split已經(jīng)分割為2份了
#fit-擬合
clf.fit(X_train, y_train)
#超參數(shù)
print(clf.best_params_)
#得分
for params, mean_score, scores in clf.gird_scores_:
 print("%.3f (+/-%.0.03f) for %r" % (mean_score, scores.std()*1.96,params))
#分類報告
y_true, y_pred = y_test, clf.predict(X_test)
print(classification_report(y_true, y_pred))

以上這篇對sklearn的使用之?dāng)?shù)據(jù)集的拆分與訓(xùn)練詳解(python3.6)就是小編分享給大家的全部內(nèi)容了，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

相關(guān)文章

python操作gitlab API過程解析
這篇文章主要介紹了python操作gitlab API過程解析,文中通過示例代碼介紹的非常詳細，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
2019-12-12
python與字符編碼問題
這篇文章主要介紹了python與字符編碼問題,下面對編碼問題做個簡單的總結(jié)，感興趣的朋友跟隨小編一起看看吧
2019-05-05
Python 文本滾動播放器的實現(xiàn)代碼
這篇文章主要介紹了Python 文本滾動播放器的實現(xiàn)代碼,本文給大家介紹的非常詳細，對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值，需要的朋友可以參考下
2021-04-04
python 缺失值處理的方法（Imputation）
這篇文章主要介紹了python 缺失值處理的方法（Imputation），文中通過示例代碼介紹的非常詳細，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
2019-07-07
python中視頻音頻的剪輯與處理實現(xiàn)
Python中輕松實現(xiàn)各種視頻處理操作,包括剪輯、合并、添加音頻、文本、特效等多種功能,主要介紹了python中視頻音頻的剪輯與處理實現(xiàn),具有一定的參考價值,感興趣的可以了解一下
2024-06-06
python opencv鼠標交互操作的實用指南
最近的工作經(jīng)常需要對圖像進行操作,也需要用鼠標對圖像進行各種操作,所以下面這篇文章主要給大家介紹了關(guān)于python opencv鼠標交互操作的相關(guān)資料,需要的朋友可以參考下
2021-10-10
Python中模擬enum枚舉類型的5種方法分享
這篇文章主要介紹了Python中模擬enum枚舉類型的5種方法分享,本文直接給出實現(xiàn)代碼,需要的朋友可以參考下
2014-11-11
解決TypeError: Object of type xxx is&
這篇文章主要介紹了解決TypeError: Object of type xxx is not JSON serializable錯誤問題，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2023-06-06
python 執(zhí)行終端/控制臺命令的例子
今天小編就為大家分享一篇python 執(zhí)行終端/控制臺命令的例子，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-07-07
Python繪制雷達圖時遇到的坑的解決
這篇文章主要介紹了Python繪制雷達圖時遇到的坑的解決，文中通過示例代碼介紹的非常詳細，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
2021-04-04