Python drop()刪除行列的操作方法
在進行特征工程、劃分數(shù)據(jù)集的工作中,drop()函數(shù)都能派上用場。它可以輕松剔除數(shù)據(jù)、操作列和操作行等。
drop()詳細的語法如下:
刪除行是index,刪除列是columns:
DataFrame.drop(labels=None, axis=0, index=None, columns=None, inplace=False)
參數(shù):
labels:要刪除的行或列的標簽,可以是單個標簽,也可以是標簽列表。
axis:要刪除的行或列的軸,0表示行,1表示列。
index:要刪除的行的索引,可以是單個索引,也可以是索引列表。
columns:要刪除的列的列名,可以是單個列名,也可以是列名列表。
inplace:是否在原DataFrame上進行操作,默認為False,即不在原DataFrame上進行操作。
刪除列
使用場景1:刪除不需要的特征。
例如:有些特征對結(jié)果的影響不大,就可以把與因變量不相關(guān)的自變量刪掉;為了避免多重共線性,要把有強相關(guān)關(guān)系的自變量刪掉。
df = data.drop(data[['RowNumber','CustomerId','Surname']],axis=1) df
代碼講解:
data是數(shù)據(jù)集,兩個中括號代表DataFrame格式,里面篩選了3個要刪除的字段;
axis=1代表操作列;
運行結(jié)果:
使用場景2:把因變量刪掉
# 自變量、因變量 x_data = df.drop(['Exited'],axis=1) y_data = df['Exited'] x_data
代碼講解:
drop()函數(shù)里面填寫要刪除的字段,表示從df中刪除名為“Exited”的列;
['Exited']這一個字段是我們要剔除的因變量,單個字段可以這樣表示;
運行結(jié)果:
刪除行
使用場景3:在劃分數(shù)據(jù)集的時候,生成了訓(xùn)練集,把被分到訓(xùn)練集的樣本剔除掉,剩下的就是測試集了。
#劃分訓(xùn)練集 train_data = data.sample(frac = 0.8, random_state = 0) #測試集 test_data = data.drop(train_data.index)
代碼講解:
drop()函數(shù)里面填行索引可以刪除掉行;
train_data是我們劃分好的訓(xùn)練集,train_data.index表示行索引;
axis=0,表示的是刪除行,也可以不寫,是默認值;
到此這篇關(guān)于Python drop()刪除行列的文章就介紹到這了,更多相關(guān)Python drop()刪除行列內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python快速進修指南之向量數(shù)據(jù)庫文本搜索
這篇文章主要為大家介紹了Java開發(fā)快速進修Python指南之向量數(shù)據(jù)庫文本搜索,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2024-01-01