Python Pandas處理csv文件常用示例
常識(shí)
- 使用
pandas.read_csv
從csv文件中讀取數(shù)據(jù),對(duì)于csv中缺失的空值,讀進(jìn)dataframe
會(huì)自動(dòng)補(bǔ)為numpy.nan
,且數(shù)據(jù)類型為float
操作
- 讀取csv文件,存儲(chǔ)為
dataframe
數(shù)據(jù)類型
df = pandas.read_csv(csv_path)
- 查看csv文件的
dataframe
的所有列字段名
print(df.columns)
- 按行遍歷
dataframe
for row in df.itertuples():
可以用row.column_name
訪問(wèn)該行具體的列(column_name
無(wú)需加引號(hào))
- 刪除
dataframe
的指定整列數(shù)據(jù)
df = df.drop(['city', 'region', 'iso_country_code'], axis=1) # 刪除列 'city', 'region', 'iso_country_code' # 這里的刪除其實(shí)并沒(méi)有對(duì)df本身作出任何改變,而是將df進(jìn)行拷貝,將拷貝的副本進(jìn)行了列刪除操作,所以這里一定要賦值給一個(gè)新的df,僅僅用df.drop并不能改變df
- 根據(jù)某個(gè)字段的值的集合條件篩選出符合條件的目標(biāo)行,以構(gòu)成新
dataframe
# 使用isin()方法篩選匹配的行 new_df = df[df['placekey'].isin(mht_poi_list)] # 篩選出df中 placekey字段的值在列表mht_poi_list中的記錄行,以構(gòu)成一個(gè)新dataframe new_df new_df = new_df.reset_index(drop=True) # 經(jīng)過(guò)篩選而得到的dataframe索引很亂,不連續(xù),這里的操作是在重排索引
- 往
dataframe
指定位置插入一整列
df.insert(loc=6, column='top_category_id', value=cate1_ids) # loc 位置 # column 列名 # value 數(shù)據(jù)來(lái)源 (這里一般我習(xí)慣用list,要求list的長(zhǎng)度要與dataframe的行數(shù)目一致)
- 將dataframe數(shù)據(jù)寫(xiě)入csv文件
df.to_csv(csv_path, index=False) # 不把行索引信息寫(xiě)入csv文件 df.to_csv(csv_path, index=True) # 把行索引信息寫(xiě)入csv文件
- 使用
list
構(gòu)建dataframe
df = pandas.DataFrame(data, columns=['head', 'relation', 'tail']) # data是一個(gè)list,data這個(gè)list里面的元素也是一個(gè)個(gè)list,每一個(gè)list表示一行數(shù)據(jù) # columns 表示列名 # data里面的list中的元素放置位置要與columns一致
到此這篇關(guān)于Python Pandas處理csv文件常用示例的文章就介紹到這了,更多相關(guān)Pandas處理csv內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
詳解如何優(yōu)化和調(diào)整Python中Scrapy的性能
在本篇高級(jí)教程中,我們將深入探討如何優(yōu)化和調(diào)整Scrapy爬蟲(chóng)的性能,以及如何處理更復(fù)雜的抓取任務(wù),如登錄,處理Cookies和會(huì)話,以及避免爬蟲(chóng)被網(wǎng)站識(shí)別和封鎖,需要的朋友可以參考下2023-09-09Python類的詳細(xì)定義與使用案例(實(shí)例講解)
這篇文章主要給大家介紹了關(guān)于Python類的詳細(xì)定義與使用案例的相關(guān)資料,在Python中類表示具有相同屬性和方法的對(duì)象的集合,文中通過(guò)代碼介紹的非常詳細(xì),需要的朋友可以參考下2023-10-10如何搜索查找并解決Django相關(guān)的問(wèn)題
每個(gè)程序員都會(huì)在開(kāi)發(fā)過(guò)程中遇到這樣或那樣的問(wèn)題, 有時(shí)光靠一個(gè)人是無(wú)法解決所有問(wèn)題的, 所以我們應(yīng)該找到適當(dāng)?shù)牡胤教釂?wèn).2014-06-06利用Python pandas對(duì)Excel進(jìn)行合并的方法示例
這篇文章主要給大家介紹了關(guān)于利用Python pandas對(duì)Excel進(jìn)行合并的方法示例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-11-11使用Python將EPUB電子書(shū)網(wǎng)文主角換成自己
通過(guò)Python對(duì)EPUB電子書(shū)格式進(jìn)行解壓、修改和重新打包,實(shí)現(xiàn)將網(wǎng)文主角名字替換成自己或其他指定名字的有趣嘗試,這一過(guò)程主要涉及zipfile和os庫(kù)的使用,以及對(duì)HTML或XHTML文件中字符串的查找與替換,感興趣的朋友一起看看吧2024-11-11Python實(shí)戰(zhàn)之利用Geopandas算出每個(gè)省面積
GeoPandas是一個(gè)基于pandas,針對(duì)地理數(shù)據(jù)做了特別支持的第三方模塊。本文將利用GeoPandas計(jì)算出每個(gè)省的面積,感興趣的小伙伴快跟隨小編一起學(xué)習(xí)一下吧2021-12-12jupyter notebook 添加kernel permission denied的操作
這篇文章主要介紹了jupyter notebook 添加kernel permission denied的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-04-04