Python Pandas處理csv文件常用示例
更新時間:2023年12月05日 11:20:29 作者:Alkali!
Pandas是一個非常強大的數(shù)據(jù)操作python包,支持各種數(shù)據(jù)格式,包括CSV文件,本文就來介紹一下Python Pandas處理csv文件常用示例,感興趣的可以了解一下
常識
- 使用
pandas.read_csv
從csv文件中讀取數(shù)據(jù),對于csv中缺失的空值,讀進dataframe
會自動補為numpy.nan
,且數(shù)據(jù)類型為float
操作
- 讀取csv文件,存儲為
dataframe
數(shù)據(jù)類型
df = pandas.read_csv(csv_path)
- 查看csv文件的
dataframe
的所有列字段名
print(df.columns)
- 按行遍歷
dataframe
for row in df.itertuples():
可以用row.column_name
訪問該行具體的列(column_name
無需加引號)
- 刪除
dataframe
的指定整列數(shù)據(jù)
df = df.drop(['city', 'region', 'iso_country_code'], axis=1) # 刪除列 'city', 'region', 'iso_country_code' # 這里的刪除其實并沒有對df本身作出任何改變,而是將df進行拷貝,將拷貝的副本進行了列刪除操作,所以這里一定要賦值給一個新的df,僅僅用df.drop并不能改變df
- 根據(jù)某個字段的值的集合條件篩選出符合條件的目標行,以構(gòu)成新
dataframe
# 使用isin()方法篩選匹配的行 new_df = df[df['placekey'].isin(mht_poi_list)] # 篩選出df中 placekey字段的值在列表mht_poi_list中的記錄行,以構(gòu)成一個新dataframe new_df new_df = new_df.reset_index(drop=True) # 經(jīng)過篩選而得到的dataframe索引很亂,不連續(xù),這里的操作是在重排索引
- 往
dataframe
指定位置插入一整列
df.insert(loc=6, column='top_category_id', value=cate1_ids) # loc 位置 # column 列名 # value 數(shù)據(jù)來源 (這里一般我習慣用list,要求list的長度要與dataframe的行數(shù)目一致)
- 將dataframe數(shù)據(jù)寫入csv文件
df.to_csv(csv_path, index=False) # 不把行索引信息寫入csv文件 df.to_csv(csv_path, index=True) # 把行索引信息寫入csv文件
- 使用
list
構(gòu)建dataframe
df = pandas.DataFrame(data, columns=['head', 'relation', 'tail']) # data是一個list,data這個list里面的元素也是一個個list,每一個list表示一行數(shù)據(jù) # columns 表示列名 # data里面的list中的元素放置位置要與columns一致
到此這篇關(guān)于Python Pandas處理csv文件常用示例的文章就介紹到這了,更多相關(guān)Pandas處理csv內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
詳解如何優(yōu)化和調(diào)整Python中Scrapy的性能
在本篇高級教程中,我們將深入探討如何優(yōu)化和調(diào)整Scrapy爬蟲的性能,以及如何處理更復(fù)雜的抓取任務(wù),如登錄,處理Cookies和會話,以及避免爬蟲被網(wǎng)站識別和封鎖,需要的朋友可以參考下2023-09-09利用Python pandas對Excel進行合并的方法示例
這篇文章主要給大家介紹了關(guān)于利用Python pandas對Excel進行合并的方法示例,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2020-11-11使用Python將EPUB電子書網(wǎng)文主角換成自己
通過Python對EPUB電子書格式進行解壓、修改和重新打包,實現(xiàn)將網(wǎng)文主角名字替換成自己或其他指定名字的有趣嘗試,這一過程主要涉及zipfile和os庫的使用,以及對HTML或XHTML文件中字符串的查找與替換,感興趣的朋友一起看看吧2024-11-11Python實戰(zhàn)之利用Geopandas算出每個省面積
GeoPandas是一個基于pandas,針對地理數(shù)據(jù)做了特別支持的第三方模塊。本文將利用GeoPandas計算出每個省的面積,感興趣的小伙伴快跟隨小編一起學習一下吧2021-12-12jupyter notebook 添加kernel permission denied的操作
這篇文章主要介紹了jupyter notebook 添加kernel permission denied的操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-04-04