欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python 機(jī)器學(xué)習(xí)工具包SKlearn的安裝與使用

 更新時(shí)間:2021年05月14日 15:36:26   作者:youcans  
Sklearn(全稱(chēng) SciKit-Learn),是基于 Python 語(yǔ)言的機(jī)器學(xué)習(xí)工具包。本文將簡(jiǎn)單的介紹SKlearn安裝與使用,想要入坑機(jī)器學(xué)習(xí)的同學(xué)可以參考下

1、SKlearn 是什么

  Sklearn(全稱(chēng) SciKit-Learn),是基于 Python 語(yǔ)言的機(jī)器學(xué)習(xí)工具包。

  Sklearn 主要用Python編寫(xiě),建立在 Numpy、Scipy、Pandas 和 Matplotlib 的基礎(chǔ)上,也用 Cython編寫(xiě)了一些核心算法來(lái)提高性能。

  Sklearn 包括六大功能模塊:

  • 分類(lèi)(Classification):識(shí)別樣本屬于哪個(gè)類(lèi)別,常用算法有 SVM(支持向量機(jī))、nearest neighbors(最近鄰)、random forest(隨機(jī)森林)
  • 回歸(Regression):預(yù)測(cè)與對(duì)象相關(guān)聯(lián)的連續(xù)值屬性,常用算法有 SVR(支持向量機(jī))、 ridge regression(嶺回歸)、Lasso
  • 聚類(lèi)(Clustering):對(duì)樣本進(jìn)行無(wú)監(jiān)督的自動(dòng)分類(lèi),常用算法有 k-Means(k均值)、spectral clustering(特征聚類(lèi))、mean-shift(均值漂移)
  • 數(shù)據(jù)降維(Dimensionality reduction):減少相關(guān)變量維數(shù),常用算法有 PCA(主成分分析)、feature selection(特征選擇)、non-negative matrix factorization(非負(fù)矩陣分解)
  • 模型選擇(Model Selection):比較,驗(yàn)證,選擇參數(shù)和模型,常用模塊有 grid search(網(wǎng)格搜索)、cross validation(交叉驗(yàn)證)、 metrics(度量)
  • 數(shù)據(jù)處理 (Preprocessing):特征提取和歸一化,常用模塊有 preprocessing(預(yù)處理),feature extraction(特征提?。?/li>
  • 這六個(gè)功能模塊涉及 4類(lèi)算法,分類(lèi)、回歸 屬于監(jiān)督學(xué)習(xí),聚類(lèi)屬于非監(jiān)督學(xué)習(xí)。

  官網(wǎng)地址:https://scikit-learn.org/

  官方文檔中文版: https://www.scikitlearn.com.cn/

  內(nèi)置數(shù)據(jù)集:https://scikit-learn.org/stable/datasets.html

2、SKlearn 的安裝

  Sklearn 的安裝要求:Python 3.5 以上版本,需要安裝 NumPy、SciPy、Pandas 工具包的支持,部分內(nèi)容需要使用 Matplotlib、joblib 工具包。

  pip 安裝命令:  

pip3 install -U scikit-learn
pip3 install -U scikit-learn -i https://pypi.douban.com/simple

  注意 Sklearn 建議安裝 Numpy+mkl,可以在網(wǎng)址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你需要的numpy+mkl版本,下載后 pip3安裝:

pip install numpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl

3、SKlearn 內(nèi)置數(shù)據(jù)集

  Sklearn 內(nèi)置了一些標(biāo)準(zhǔn)數(shù)據(jù)集可以用于練習(xí)和測(cè)試,都是經(jīng)常被引用的經(jīng)典問(wèn)題,數(shù)據(jù)網(wǎng)址:https://scikit-learn.org/stable/datasets.html  
  Sklearn 標(biāo)準(zhǔn)數(shù)據(jù)集主要包括:

測(cè)試問(wèn)題數(shù)據(jù)集

  • 波士頓房?jī)r(jià):Boston house prices dataset
  • 鳶尾花問(wèn)題:Iris plants dataset
  • 糖尿病數(shù)據(jù):Diabetes dataset
  • 手寫(xiě)數(shù)字的識(shí)別:Optical recognition of handwritten digits dataset
  • 體能訓(xùn)練:Linnerrud dataset
  • 葡萄酒鑒別:Wine recognition dataset
  • 威斯康星州癌癥診斷:reast cancer wisconsin (diagnostic) dataset

實(shí)際問(wèn)題數(shù)據(jù)集

  • 人臉數(shù)據(jù):The Olivetti faces dataset
  • 20個(gè)新聞文本數(shù)據(jù):The 20 newsgroups text dataset
  • 標(biāo)記的人臉數(shù)據(jù):The Labeled Faces in the Wild face recognition dataset
  • 森林覆蓋類(lèi)型:Forest covertypes
  • 路透社新聞數(shù)據(jù):RCV1 dataset
  • 網(wǎng)絡(luò)入侵檢測(cè)數(shù)據(jù):Kddcup 99 dataset
  • 加州住房數(shù)據(jù):California Housing dataset

4、Sklearn 數(shù)模筆記的計(jì)劃

  粗略看看 Sklearn 的文檔,是一個(gè)功能強(qiáng)大和豐富的機(jī)器學(xué)習(xí)庫(kù),遠(yuǎn)遠(yuǎn)超出了數(shù)學(xué)建模學(xué)習(xí)的范圍。
  基于數(shù)模教學(xué)的目的,本系列主要對(duì)應(yīng)數(shù)模學(xué)習(xí)中的分類(lèi)、聚類(lèi)、降維問(wèn)題,并不打算全面講解 Sklearn 的各種算法,而是以典型問(wèn)題為例來(lái)介紹原理簡(jiǎn)單、使用廣泛的基本方法,以便新手入門(mén)。

以上就是Python 機(jī)器學(xué)習(xí)工具包SKlearn的安裝與使用的詳細(xì)內(nèi)容,更多關(guān)于Python SKlearn的安裝與使用的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • 淺析python,PyCharm,Anaconda三者之間的關(guān)系

    淺析python,PyCharm,Anaconda三者之間的關(guān)系

    Python是一種跨平臺(tái)的計(jì)算機(jī)程序設(shè)計(jì)語(yǔ)言,簡(jiǎn)單來(lái)說(shuō),python就是類(lèi)似于C,Java,C++等,一種編程語(yǔ)言。這篇文章主要介紹了淺析python,PyCharm,Anaconda三者之間的關(guān)系,需要的朋友可以參考下
    2019-11-11
  • Python中Socket編程底層原理解析與應(yīng)用實(shí)戰(zhàn)

    Python中Socket編程底層原理解析與應(yīng)用實(shí)戰(zhàn)

    Socket編程是網(wǎng)絡(luò)通信的基礎(chǔ),Python通過(guò)內(nèi)置的socket模塊提供了強(qiáng)大的網(wǎng)絡(luò)編程接口,本文將結(jié)合實(shí)際案例,詳細(xì)介紹Python中Socket編程的基本概念、常用方法和實(shí)際應(yīng)用,需要的朋友可以參考下
    2024-08-08
  • 基于python實(shí)現(xiàn)分析識(shí)別文章/內(nèi)容中的高頻詞和關(guān)鍵詞

    基于python實(shí)現(xiàn)分析識(shí)別文章/內(nèi)容中的高頻詞和關(guān)鍵詞

    要分析一篇文章的高頻詞和關(guān)鍵詞,可以使用 Python 中的 nltk 庫(kù)和 collections 庫(kù)或者jieba庫(kù)來(lái)實(shí)現(xiàn),本篇文章介紹基于兩種庫(kù)分別實(shí)現(xiàn)分析內(nèi)容中的高頻詞和關(guān)鍵詞,需要的朋友可以參考下
    2023-09-09
  • Python利用pandas計(jì)算多個(gè)CSV文件數(shù)據(jù)值的實(shí)例

    Python利用pandas計(jì)算多個(gè)CSV文件數(shù)據(jù)值的實(shí)例

    下面小編就為大家分享一篇Python利用pandas計(jì)算多個(gè)CSV文件數(shù)據(jù)值的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2018-04-04
  • Python Numpy 數(shù)組的初始化和基本操作

    Python Numpy 數(shù)組的初始化和基本操作

    Python 是一種高級(jí)的,動(dòng)態(tài)的,多泛型的編程語(yǔ)言。接下來(lái)通過(guò)本文給大家介紹Python Numpy 數(shù)組的初始化和基本操作,感興趣的朋友一起看看吧
    2018-03-03
  • Python進(jìn)行圖片驗(yàn)證碼識(shí)別方法步驟

    Python進(jìn)行圖片驗(yàn)證碼識(shí)別方法步驟

    這篇文章主要給大家介紹了關(guān)于Python進(jìn)行圖片驗(yàn)證碼識(shí)別的相關(guān)資料,基于Python和OpenCV的驗(yàn)證碼識(shí)別系統(tǒng)具有重要的研究意義和實(shí)際應(yīng)用價(jià)值,文中通過(guò)代碼介紹的非常詳細(xì),需要的朋友可以參考下
    2023-09-09
  • Python基礎(chǔ)面向?qū)ο笾^承與派生詳解

    Python基礎(chǔ)面向?qū)ο笾^承與派生詳解

    這篇文章主要為大家介紹了Python基礎(chǔ)面向?qū)ο笾^承與派生詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2022-11-11
  • 基于python模擬TCP3次握手連接及發(fā)送數(shù)據(jù)

    基于python模擬TCP3次握手連接及發(fā)送數(shù)據(jù)

    這篇文章主要介紹了基于python模擬TCP3次握手連接及發(fā)送數(shù)據(jù),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-11-11
  • Python 包含漢字的文件讀寫(xiě)之每行末尾加上特定字符

    Python 包含漢字的文件讀寫(xiě)之每行末尾加上特定字符

    這篇文章主要介紹了Python 包含漢字的文件讀寫(xiě)之每行末尾加上特定字符的相關(guān)資料,需非常不錯(cuò),具有參考借鑒價(jià)值,要的朋友可以參考下
    2016-12-12
  • 使用Python的turtle模塊畫(huà)國(guó)旗

    使用Python的turtle模塊畫(huà)國(guó)旗

    這篇文章主要為大家詳細(xì)介紹了用Python的turtle模塊畫(huà)國(guó)旗,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2019-09-09

最新評(píng)論