python sklearn庫實(shí)現(xiàn)簡單邏輯回歸的實(shí)例代碼
Sklearn簡介
Scikit-learn(sklearn)是機(jī)器學(xué)習(xí)中常用的第三方模塊,對常用的機(jī)器學(xué)習(xí)方法進(jìn)行了封裝,包括回歸(Regression)、降維(Dimensionality Reduction)、分類(Classfication)、聚類(Clustering)等方法。當(dāng)我們面臨機(jī)器學(xué)習(xí)問題時(shí),便可根據(jù)下圖來選擇相應(yīng)的方法。
Sklearn具有以下特點(diǎn):
- 簡單高效的數(shù)據(jù)挖掘和數(shù)據(jù)分析工具
- 讓每個(gè)人能夠在復(fù)雜環(huán)境中重復(fù)使用
- 建立NumPy、Scipy、MatPlotLib之上
代碼如下所示:
import xlrd import matplotlib.pyplot as plt import numpy as np from sklearn import model_selection from sklearn.linear_model import LogisticRegression from sklearn import metrics data = xlrd.open_workbook('gua.xlsx') sheet = data.sheet_by_index(0) Density = sheet.col_values(6) Sugar = sheet.col_values(7) Res = sheet.col_values(8) # 讀取原始數(shù)據(jù) X = np.array([Density, Sugar]) # y的尺寸為(17,) y = np.array(Res) X = X.reshape(17,2) # 繪制分類數(shù)據(jù) f1 = plt.figure(1) plt.title('watermelon_3a') plt.xlabel('density') plt.ylabel('ratio_sugar') # 繪制散點(diǎn)圖(x軸為密度,y軸為含糖率) plt.scatter(X[y == 0,0], X[y == 0,1], marker = 'o', color = 'k', s=100, label = 'bad') plt.scatter(X[y == 1,0], X[y == 1,1], marker = 'o', color = 'g', s=100, label = 'good') plt.legend(loc = 'upper right') plt.show() # 從原始數(shù)據(jù)中選取一半數(shù)據(jù)進(jìn)行訓(xùn)練,另一半數(shù)據(jù)進(jìn)行測試 X_train, X_test, y_train, y_test = model_selection.train_test_split(X, y, test_size=0.5, random_state=0) # 邏輯回歸模型 log_model = LogisticRegression() # 訓(xùn)練邏輯回歸模型 log_model.fit(X_train, y_train) # 預(yù)測y的值 y_pred = log_model.predict(X_test) # 查看測試結(jié)果 print(metrics.confusion_matrix(y_test, y_pred)) print(metrics.classification_report(y_test, y_pred))
總結(jié)
以上所述是小編給大家介紹的python sklearn庫實(shí)現(xiàn)簡單邏輯回歸的實(shí)例代碼,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
如果你覺得本文對你有幫助,歡迎轉(zhuǎn)載,煩請注明出處,謝謝!
相關(guān)文章
Python深度強(qiáng)化學(xué)習(xí)之DQN算法原理詳解
DQN算法是DeepMind團(tuán)隊(duì)提出的一種深度強(qiáng)化學(xué)習(xí)算法,在許多電動(dòng)游戲中達(dá)到人類玩家甚至超越人類玩家的水準(zhǔn),本文就帶領(lǐng)大家了解一下這個(gè)算法,快來跟隨小編學(xué)習(xí)一下2021-12-12pandas中DataFrame.to_dict()的實(shí)現(xiàn)示例
本文主要介紹了pandas中DataFrame.to_dict()的實(shí)現(xiàn)示例,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2024-08-08如何將matlab數(shù)據(jù)導(dǎo)入到Python中使用
這篇文章主要介紹了如何將matlab數(shù)據(jù)導(dǎo)入到Python中使用,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2022-12-12python?pandas分割DataFrame中的字符串及元組的方法實(shí)現(xiàn)
本文主要介紹了python?pandas分割DataFrame中的字符串及元組的方法實(shí)現(xiàn),主要介紹了3種方法,具有一定的參考價(jià)值,感興趣的可以了解一下2022-03-03Python實(shí)現(xiàn)發(fā)送QQ郵件的封裝
這篇文章主要為大家詳細(xì)介紹了Python實(shí)現(xiàn)發(fā)送QQ郵件的具體代碼,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-07-07Keras SGD 隨機(jī)梯度下降優(yōu)化器參數(shù)設(shè)置方式
這篇文章主要介紹了Keras SGD 隨機(jī)梯度下降優(yōu)化器參數(shù)設(shè)置方式,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-06-06