欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python使用pandas抽樣訓練數(shù)據(jù)中某個類別實例

 更新時間:2020年02月28日 11:25:28   作者:Yan456jie  
今天小編就為大家分享一篇python使用pandas抽樣訓練數(shù)據(jù)中某個類別實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧

廢話真的一句也不想多說,直接看代碼吧!

# -*- coding: utf-8 -*- 
 
import numpy 
from sklearn import metrics 
from sklearn.svm import LinearSVC 
from sklearn.naive_bayes import MultinomialNB 
from sklearn import linear_model 
from sklearn.datasets import load_iris 
from sklearn.cross_validation import train_test_split 
from sklearn.preprocessing import OneHotEncoder, StandardScaler 
from sklearn import cross_validation 
from sklearn import preprocessing 
import scipy as sp
from sklearn.linear_model import LogisticRegression
from sklearn.feature_selection import SelectKBest ,chi2
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
#import iris_data 
 
'''
creativeID,userID,positionID,clickTime,conversionTime,connectionType,
telecomsOperator,appPlatform,sitesetID,positionType,age,gender,
education,marriageStatus,haveBaby,hometown,residence,appID,appCategory,label
'''
 
 
def test():
 df = pd.read_table("/var/lib/mysql-files/data1.csv", sep=",")
 df1 = df[["connectionType","telecomsOperator","appPlatform","sitesetID",
    "positionType","age","gender","education","marriageStatus",
    "haveBaby","hometown","residence","appCategory","label"]]
 print df1["label"].value_counts()
 N_data = df1[df1["label"]==0]
 P_data = df1[df1["label"]==1]
 N_data = N_data.sample(n=P_data.shape[0], frac=None, replace=False, weights=None, random_state=2, axis=0)
 #print df1.loc[:,"label"]==0
 print P_data.shape
 print N_data.shape
 
 data = pd.concat([N_data,P_data])
 print data.shape
 data = data.sample(frac=1).reset_index(drop=True) 
 print data[["label"]]
 return

補充拓展:pandas實現(xiàn)對dataframe抽樣

隨機抽樣

import pandas as pd
#對dataframe隨機抽取2000個樣本
pd.sample(df, n=2000)

分層抽樣

利用sklean中的函數(shù)靈活進行抽樣

from sklearn.model_selection import train_test_split
#y是在X中的某一個屬性列
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, stratify=y)

以上這篇python使用pandas抽樣訓練數(shù)據(jù)中某個類別實例就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。

相關文章

  • python機器學習之貝葉斯分類

    python機器學習之貝葉斯分類

    這篇文章主要為大家詳細介紹了python機器學習之貝葉斯分類的相關資料,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2018-03-03
  • Python黑魔法之metaclass詳情

    Python黑魔法之metaclass詳情

    Python 有很多黑魔法,為了不分你的心,今天只講 metaclass。對于 metaclass 這種特性,有兩種極端的觀點:下面小編將為大家詳細的介紹,剛興趣的小伙伴可以參考一下
    2021-09-09
  • python實現(xiàn)合并兩個有序列表的示例代碼

    python實現(xiàn)合并兩個有序列表的示例代碼

    這篇文章主要介紹了python實現(xiàn)合并兩個有序列表的示例代碼,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2021-04-04
  • opencv python簡易文檔之圖像處理算法

    opencv python簡易文檔之圖像處理算法

    OpenCV是一個開源庫,包含了許多計算機視覺算法,它在計算機視覺和圖像處理中起著重要作用,用于實時操作,其效率足以滿足工業(yè)上的要求,這篇文章主要給大家介紹了關于opencv python簡易文檔之圖像處理算法的相關資料,需要的朋友可以參考下
    2021-08-08
  • Django-Xadmin后臺首頁添加小組件報錯的解決方案

    Django-Xadmin后臺首頁添加小組件報錯的解決方案

    這篇文章主要介紹了Django-Xadmin后臺首頁添加小組件報錯的解決方案,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
    2023-08-08
  • python實現(xiàn)將html表格轉換成CSV文件的方法

    python實現(xiàn)將html表格轉換成CSV文件的方法

    這篇文章主要介紹了python實現(xiàn)將html表格轉換成CSV文件的方法,涉及Python操作csv文件的相關技巧,需要的朋友可以參考下
    2015-06-06
  • Python3 sys.argv[ ]用法詳解

    Python3 sys.argv[ ]用法詳解

    這篇文章主要介紹了Python3 sys.argv[ ]用法詳解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2019-10-10
  • Pandas自定義選項option設置

    Pandas自定義選項option設置

    pandas有一個option系統(tǒng)可以控制pandas的展示情況,一般來說我們不需要進行修改,但是不排除特殊情況下的修改需求。本文將會詳細講解pandas中的option設置,感興趣的可以了解下
    2021-07-07
  • Python實現(xiàn)接受任意個數(shù)參數(shù)的函數(shù)方法

    Python實現(xiàn)接受任意個數(shù)參數(shù)的函數(shù)方法

    下面小編就為大家分享一篇Python實現(xiàn)接受任意個數(shù)參數(shù)的函數(shù)方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-04-04
  • 使用python數(shù)據(jù)清洗代碼實例

    使用python數(shù)據(jù)清洗代碼實例

    這篇文章主要介紹了使用python數(shù)據(jù)清洗代碼實例,分享一下近期用python做數(shù)據(jù)清洗匯總的相關代碼,這里我們用到的python包有pandas、numpy、os等,需要的朋友可以參考下
    2023-07-07

最新評論