pandas添加自增列的2種實(shí)現(xiàn)方案
有時(shí)候我們需要添加一列自動(dòng)增加數(shù)字的列,可以用下面兩種方法:
第一種
>>> import pandas as pd >>> df = pd.DataFrame([{'name':'apple', 'count':4},\ {'name':'orange', 'count':2}]) >>> df = df.reset_index() >>> df.columns.values[0] = 'New_ID' >>> df['New_ID'] = df.index + 880 >>> df New_ID name count New_ID 0 0 apple 4 880 1 1 orange 2 881
第二種
>>> import pandas as pd >>> df = pd.DataFrame([{'name':'apple', 'count':4},\ {'name':'orange', 'count':2}]) >>> df.insert(0, 'New_ID', range(880, 880 + len(df))) >>> df New_ID name count 0 880 apple 4 1 881 orange 2
補(bǔ)充:pandas新增一列作為id,或者新增有默認(rèn)值的一列
原始數(shù)據(jù):
我們想要在text這一列前面加上一列作為id(數(shù)字從小到大吧),在后面加上一列作為標(biāo)簽,默認(rèn)0吧
import pandas as pd data = pd.read_csv('test.txt') n = len(data)+1 nlist = range(1,n) data['id'] = nlist data['label'] = 0 print(data.head()) data.to_csv('newTest.csv',columns=['id','text','label'],index=0,header=1) 可以加上 df=pd.read_csv(sourceFile,low_memory=False) #讀取csv,設(shè)置low_memory=False防止內(nèi)存不夠時(shí)報(bào)警告 #以下保存指定的列到新的csv文件,index=0表示不為每一行自動(dòng)編號(hào),header=1表示行首有字段名稱(chēng)
最后數(shù)據(jù):
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
Caffe卷積神經(jīng)網(wǎng)絡(luò)solver及其配置詳解
這篇文章主要為大家介紹了Caffe卷積神經(jīng)網(wǎng)絡(luò)solver及其配置詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-06-06解決IDEA 的 plugins 搜不到任何的插件問(wèn)題
這篇文章主要介紹了解決IDEA 的 plugins 搜不到任何的插件問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-05-05Windows環(huán)境中Python應(yīng)用服務(wù)自啟動(dòng)及其監(jiān)控問(wèn)題
這篇文章主要介紹了Windows環(huán)境中Python應(yīng)用服務(wù)自啟動(dòng)及其監(jiān)控問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-06-06python?包實(shí)現(xiàn)?time?時(shí)間管理操作
這篇文章主要介紹了python包實(shí)現(xiàn)time時(shí)間管理操作,文章通過(guò)獲取當(dāng)前時(shí)間戳,即當(dāng)前系統(tǒng)內(nèi)表示時(shí)間的一個(gè)浮點(diǎn)數(shù),下文更多相關(guān)內(nèi)容需要的小伙伴可以參考一下2022-04-04Python爬蟲(chóng)動(dòng)態(tài)ip代理防止被封的方法
在本篇文章中小編給大家整理了關(guān)于Python爬蟲(chóng)動(dòng)態(tài)ip代理防止被封的方法以及實(shí)例代碼,需要的朋友們學(xué)習(xí)下。2019-07-07