Python機(jī)器學(xué)習(xí)iris數(shù)據(jù)集預(yù)處理和模型訓(xùn)練方式
一、iris數(shù)據(jù)集簡(jiǎn)介
iris數(shù)據(jù)集的中文名是安德森鳶尾花卉數(shù)據(jù)集,英文全稱是Anderson`s Iris data set。iris包含150個(gè)樣本,對(duì)應(yīng)數(shù)據(jù)集的每行數(shù)據(jù)。
每行數(shù)據(jù)包含每個(gè)樣本的四個(gè)特征和樣本的類別信息,所以iris數(shù)據(jù)集是一個(gè)150行5列的二維表。
通俗地說(shuō),iris數(shù)據(jù)集是用來(lái)給花做分類的數(shù)據(jù)集,每個(gè)樣本包含了花萼長(zhǎng)度、花萼寬度、花瓣長(zhǎng)度、花瓣寬度四個(gè)特征(前4列),我們需要建立一個(gè)分類器,分類器可以通過(guò)樣本的四個(gè)特征來(lái)判斷樣本屬于山鳶尾(setosa)、變色鳶尾(versicolor)、維吉尼亞鳶尾(virginica)這三個(gè)名詞都是花的品種。iris的每個(gè)樣本都包含了品種信息,即目標(biāo)屬性(第5列,也叫target或label)
如圖所示部分?jǐn)?shù)據(jù):

iris在機(jī)器學(xué)習(xí)中的應(yīng)用:
- 屬于監(jiān)督式學(xué)習(xí)應(yīng)用:根據(jù)花的四個(gè)特征預(yù)測(cè)鳶尾花卉屬于(iris-setosa,iris-versicolour,iris-virginica)中的那一品種。
- 機(jī)器學(xué)習(xí)中經(jīng)典案例,簡(jiǎn)單而具有代表性。
二、基本數(shù)據(jù)操作和模型訓(xùn)練
1.加載iris數(shù)據(jù)集
# iris數(shù)據(jù)集加載 from sklearn import datasets iris = datasets.load_iris()
2.展示所有數(shù)據(jù)
#展示數(shù)據(jù)
print(iris.data
)3.展示每列的屬性名
print(iris.feature_names)
4.展示輸出目標(biāo)結(jié)果以及結(jié)果的含義
print(iris.target) print(iris.target_names)
5.查看輸入和輸出數(shù)據(jù)類型
print(type(iris.data)) print(type(iris.target))
6.確認(rèn)行列維度
print(iris.data.shape) print(iris.target.shape)
7.給x,y賦值
X =iris.data Y = iris.target
8.利用knn模型進(jìn)行預(yù)測(cè)結(jié)果
from sklearn.neighbors import KNeighborsClassifier #創(chuàng)建實(shí)例,假設(shè)k值為1 knn = KNeighborsClassifier(n_neighbors=1) #訓(xùn)練數(shù)據(jù)集模型 knn.fit(x,y)
9.給定特征的值預(yù)測(cè)花的品種
#預(yù)測(cè)某種花的品種 knn.predict([[1,2,3,4]])

得到數(shù)組的數(shù)據(jù) “2” ,它代表的是花萼長(zhǎng)度為1、花萼寬度為2、花瓣長(zhǎng)度為3、花瓣寬度為4的鳶尾花卉預(yù)測(cè)結(jié)果的品種是第三種:維吉尼亞鳶尾(virginica)
#多種花的預(yù)測(cè) x_test = [[1,2,3,4],[2,4,1,2]] knn.predict(x_test) `

得到數(shù)組的數(shù)據(jù) “2” 和 “0”,它代表的是
- 花萼長(zhǎng)度為1、花萼寬度為2、花瓣長(zhǎng)度為3、花瓣寬度為4的鳶尾花卉預(yù)測(cè)結(jié)果的品種是第三種:維吉尼亞鳶尾(virginica)
- 花萼長(zhǎng)度為2、花萼寬度為4、花瓣長(zhǎng)度為1、花瓣寬度為2的鳶尾花卉預(yù)測(cè)結(jié)果的品種是第一種:山鳶尾(setosa)
總結(jié)
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python使用psutil對(duì)系統(tǒng)數(shù)據(jù)進(jìn)行采集監(jiān)控
psutil庫(kù)可以實(shí)時(shí)獲取系統(tǒng)的一些信息,這樣就可以達(dá)到實(shí)時(shí)監(jiān)控系統(tǒng)的目的。本文對(duì)詳細(xì)講解了ython使用psutil對(duì)系統(tǒng)數(shù)據(jù)進(jìn)行采集監(jiān)控,感興趣的朋友可以看一看2021-08-08
Python?hashlib模塊與哈希算法保護(hù)數(shù)據(jù)完整性教程
hashlib模塊為Python提供了一種簡(jiǎn)便的方式來(lái)使用各種哈希算法,如MD5、SHA-1、SHA-256等,哈希函數(shù)廣泛用于密碼學(xué)、數(shù)據(jù)完整性驗(yàn)證和安全存儲(chǔ)等領(lǐng)域2024-01-01
python多進(jìn)程日志以及分布式日志的實(shí)現(xiàn)方式
這篇文章主要介紹了python多進(jìn)程日志以及分布式日志的實(shí)現(xiàn)方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-06-06
Python?虛擬環(huán)境遷移到其他電腦的實(shí)現(xiàn)
本文主要介紹了Python?虛擬環(huán)境遷移到其他電腦的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2023-04-04
Python自動(dòng)檢測(cè)requests所獲得html文檔的編碼
這篇文章主要為大家詳細(xì)介紹了如何通過(guò)Python自動(dòng)檢測(cè)requests實(shí)現(xiàn)獲得html文檔的編碼,文中的示例代碼講解詳細(xì),感興趣的可以了解下2024-11-11
pandas調(diào)整列的順序以及添加列的實(shí)現(xiàn)
這篇文章主要介紹了pandas調(diào)整列的順序以及添加列的實(shí)現(xiàn)操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-03-03

