Pandas DataFrame操作數(shù)據(jù)增刪查改
一、DataFrame數(shù)據(jù)準(zhǔn)備
增、刪、改、查的方法有很多很多種,這里只展示出常用的幾種。
參數(shù)inplace默認(rèn)為False,只能在生成的新數(shù)據(jù)塊中實現(xiàn)編輯效果。當(dāng)inplace=True時執(zhí)行內(nèi)部編輯,不返回任何值,原數(shù)據(jù)發(fā)生改變。
import numpy as np import pandas as pd #測試數(shù)據(jù)。 df = pd.DataFrame(data = [['lisa','f',22],['joy','f',22],['tom','m','21']],index = [1,2,3],columns = ['name','sex','age'])
數(shù)據(jù):
name sex age
1 lisa f 22
2 joy f 22
3 tom m 21
二、增刪改查操作
1,增
(1).按列增加
citys = ['ny','zz','xy'] df.insert(0,'city',citys) #在第0列,加上column名稱為city,值為citys的數(shù)值。 jobs = ['student','AI','teacher'] df['job'] = jobs #默認(rèn)在df最后一列加上column名稱為job,值為jobs的數(shù)據(jù)。 df.loc[:,'salary'] = ['1k','2k','2k','2k','3k'] #在df最后一列加上column名稱為salary,值為等號右邊數(shù)據(jù)。
(2)按行增加
若df中沒有index為“4”的這一行的話,該行代碼作用是往df中加一行index為“4”,值為等號右邊值的數(shù)據(jù)。若df中已經(jīng)有index為“4”的這一行,則該行代碼作用是把df中index為“4”的這一行修改為等號右邊數(shù)據(jù)。
df.loc[4] = ['zz','mason','m',24,'engineer'] df_insert = pd.DataFrame({'name':['mason','mario'],'sex':['m','f'],'age':[21,22]},index = [4,5]) ndf = df.append(df_insert,ignore_index = True)
返回添加后的值,并不會修改df的值。ignore_index默認(rèn)為False,意思是不忽略index值,即生成的新的ndf的index采用df_insert中的index值。若為True,則新的ndf的index值不使用df_insert中的index值,而是自己默認(rèn)生成。
2,查
(1)方法一:df[‘column_name’] 和df[row_start_index, row_end_index]
df['name'] df['gender'] df[['name','gender']] #選取多列,多列名字要放在list里 df[0:] #第0行及之后的行,相當(dāng)于df的全部數(shù)據(jù),注意冒號是必須的 df[:2] #第2行之前的數(shù)據(jù)(不含第2行) df[0:1] #第0行 df[1:3] #第1行到第2行(不含第3行) df[-1:] #最后一行 df[-3:-1] #倒數(shù)第3行到倒數(shù)第1行(不包含最后1行即倒數(shù)第1行,這里有點煩躁,因為從前數(shù)時從第0行開始,從后數(shù)就是-1行開始,畢竟沒有-0)
(2)方法一:df.loc[index,column]
df.loc[index, column_name],選取指定行和列的數(shù)據(jù)
df.loc[0,'name'] # 'Snow' df.loc[0:2, ['name','age']] #選取第0行到第2行,name列和age列的數(shù)據(jù), 注意這里的行選取是包含下標(biāo)的。 df.loc[[2,3],['name','age']] #選取指定的第2行和第3行,name和age列的數(shù)據(jù) df.loc[df['gender']=='M','name'] #選取gender列是M,name列的數(shù)據(jù) df.loc[df['gender']=='M',['name','age']] #選取gender列是M,name和age列的數(shù)據(jù)
(3)方法三:iloc[row_index, column_index]
''' 學(xué)習(xí)中遇到問題沒人解答?小編創(chuàng)建了一個Python學(xué)習(xí)交流群:711312441 尋找有志同道合的小伙伴,互幫互助,群里還有不錯的視頻學(xué)習(xí)教程和PDF電子書! ''' df.iloc[0,0] #第0行第0列的數(shù)據(jù),'Snow' df.iloc[1,2] #第1行第2列的數(shù)據(jù),32 df.iloc[[1,3],0:2] #第1行和第3行,從第0列到第2列(不包含第2列)的數(shù)據(jù) df.iloc[1:3,[1,2] #第1行到第3行(不包含第3行),第1列和第2列的數(shù)據(jù)
3,改
(1)改行列標(biāo)題
df.columns = ['name','gender','age'] #盡管我們只想把'sex'改為'gender',但是仍然要把所有的列全寫上,否則報錯。 df.rename(columns = {'name':'Name','age':'Age'},inplace = True) #只修改name和age。inplace若為True,直接修改df,否則,不修改df,只是返回一個修改后的數(shù)據(jù)。 df.index = list('abc')#把index改為a,b,c.直接修改了df。 df.rename({1:'a',2:'b',3:'c'},axis = 0,inplace = True)#無返回值,直接修改df的index。
(2)改數(shù)值
使用loc
df.loc[1,'name'] = 'aa' #修改index為‘1',column為‘name'的那一個值為aa。 df.loc[1] = ['bb','ff',11] #修改index為‘1'的那一行的所有值。 df.loc[1,['name','age']] = ['bb',11] #修改index為‘1',column為‘name'的那一個值為bb,age列的值為11。
使用iloc[row_index, column_index]
df.iloc[1,2] = 19 #修改某一無素 df.iloc[:,2] = [11,22,33] #修改一整列 df.iloc[0,:] = ['lily','F',15] #修改一整行
4,刪
(1)刪除行
df.drop([1,3],axis = 0,inplace = False)#刪除index值為1和3的兩行,
(2)刪除列
df.drop(['name'],axis = 1,inplace = False) #刪除name列。 del df['name'] #刪除name列。 ndf = df.pop('age') #刪除age列,操作后,df都丟掉了age列,age列返回給了ndf。
到此這篇關(guān)于Pandas DataFrame操作數(shù)據(jù)增刪查改的文章就介紹到這了,更多相關(guān)Pandas DataFrame內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Pytorch使用技巧之Dataloader中的collate_fn參數(shù)詳析
collate_fn 參數(shù)的目的主要是為了隨心所欲的轉(zhuǎn)變數(shù)據(jù)的類型,這個數(shù)據(jù)是用DataLoader加載的,比如img,target,下面這篇文章主要給大家介紹了關(guān)于Pytorch使用技巧之Dataloader中的collate_fn參數(shù)的相關(guān)資料,需要的朋友可以參考下2022-03-03python根據(jù)用戶需求輸入想爬取的內(nèi)容及頁數(shù)爬取圖片方法詳解
這篇文章主要介紹了python根據(jù)用戶需求輸入想爬取的內(nèi)容及頁數(shù)爬取圖片方法詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-08-08用Python爬取各大高校并可視化幫弟弟選大學(xué),弟弟直呼牛X
高考結(jié)束了,接下來最重要的就是玩玩玩,然后準(zhǔn)備報志愿吧.中國教育在線網(wǎng)顯示國內(nèi)目前共有2857所高等院校,報一個理想的學(xué)校簡直是千里挑一.正好表弟求著我讓我?guī)退x學(xué)校,我想著十年寒窗苦讀也不容易不如就用python幫幫他.分析一下目前國內(nèi)的大學(xué),需要的朋友可以參考下2021-06-06