欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python使用Pandas對csv文件進行數據處理的方法

 更新時間:2019年08月01日 11:11:00   作者:香香爹  
這篇文章主要介紹了Python使用Pandas對csv文件進行數據處理的方法,本文通過實例代碼相結合給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下

今天接到一個新的任務,要對一個140多M的csv文件進行數據處理,總共有170多萬行,嘗試了導入本地的MySQL數據庫進行查詢,結果用Navicat導入直接卡死....估計是XAMPP套裝里面全默認配置的MySQL性能不給力,又嘗試用R搞一下吧結果發(fā)現光加載csv文件就要3分鐘左右的時間,相當不給力啊,翻了翻萬能的知乎發(fā)現了Python下的一個神器包:Pandas(熊貓們?),加載這個140多M的csv文件兩秒鐘就搞定,后面的分類匯總等操作也都是秒開,太牛逼了!記錄一下這次數據處理的過程:

使用Python3.6.4環(huán)境(對中文支持比較好),安裝Pandas包

pip install pandas

基本使用:

import pandas as pd
import numpy as np #進行具體的sum,count等計算時候要用到的
df=pd.read_csv('d:/snp/nh23.csv') #這里絕對路徑一定要用/,windows下也是如此,不加參數默認csv文件首行為標題行
df.head() #查看引入的csv文件前5行數據
df[“播種面積”] #查看指定列,后面跟[:5]查看前5行數據

df[“調查對象代碼”].str[:6] #獲取指定列前6位字符串

df["ADDR"]=df["調查對象代碼"].str[:6] #將上一行處理后的6位地址碼作為新列ADDR插入

gp=df.groupby(["ADDR","代碼"])["播種面積"].sum() #根據ADDR和代碼進行分組后對播種面積列進行sum求和計算

pv=df.pivot_table(["播種面積"],index="ADDR",columns="代碼",margins=True,aggfunc=np.sum,fill_value=0) #數據透視圖,對播種面積列進行匯總計算,index為行,columns為列,margins=True增加一個全部行匯總,aggfunc=np.sum透視圖中對播種面積值進行sum計算,這里np是開頭import的numpy as np,fill_value=0對空值進行0替換,否則沒有數據會顯示NaN

pv.to_csv("d:/snp/test.csv") #寫入csv文件

總結

以上所述是小編給大家介紹的Python使用Pandas對csv文件進行數據處理的方法,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網站的支持!
如果你覺得本文對你有幫助,歡迎轉載,煩請注明出處,謝謝!

相關文章

  • Python中@符號的用法小結

    Python中@符號的用法小結

    @符號在Python中最常見的使用情況是在裝飾器中,本文主要介紹了Python中@符號的用法小結,具有一定的參考價值,感興趣的可以了解一下
    2023-09-09
  • python中l(wèi)ist*n生成多維數組與for循環(huán)生成多維數組的區(qū)別說明

    python中l(wèi)ist*n生成多維數組與for循環(huán)生成多維數組的區(qū)別說明

    這篇文章主要介紹了python中l(wèi)ist*n生成多維數組與for循環(huán)生成多維數組的區(qū)別說明,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-05-05
  • python的Template使用指南

    python的Template使用指南

    本文主要講解了python中Template使用方法以及使用技巧,非常實用,有需要的朋友可以參考下
    2014-09-09
  • springboot aop方式實現接口入參校驗的示例代碼

    springboot aop方式實現接口入參校驗的示例代碼

    在實際開發(fā)項目中,我們常常需要對接口入參進行校驗,本文主要介紹了springboot aop方式實現接口入參校驗的示例代碼,具有一定的參考價值,感興趣的可以了解一下
    2023-08-08
  • Python中OpenCV實現查找輪廓的實例

    Python中OpenCV實現查找輪廓的實例

    本文將結合實例代碼,介紹 OpenCV 如何查找輪廓、獲取邊界框。具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2021-06-06
  • Python實戰(zhàn)之異步獲取中國天氣信息

    Python實戰(zhàn)之異步獲取中國天氣信息

    這篇文章主要介紹了如何利用Python爬蟲異步獲取天氣信息,用的API是中國天氣網。文中的示例代碼講解詳細,感興趣的小伙伴可以動手試一試
    2022-03-03
  • 一文學會VSCode使用python

    一文學會VSCode使用python

    Pycharm用著卡還收費!何不試試VSCode!一文學會VSCode使用python,本文通過圖文實例相結合給大家介紹的非常詳細,需要的朋友參考下吧
    2021-08-08
  • python編寫softmax函數、交叉熵函數實例

    python編寫softmax函數、交叉熵函數實例

    這篇文章主要介紹了python編寫softmax函數、交叉熵函數實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-06-06
  • face_recognition庫在python的安裝

    face_recognition庫在python的安裝

    這篇文章主要介紹了face_recognition庫在python的安裝,解決了一些沒有安裝時出現的一些錯誤,需要的朋友可以參考下
    2021-04-04
  • 詳解如何使用python打印出多樣字符

    詳解如何使用python打印出多樣字符

    當你第一次進入Python的世界里,學到的第一句代碼是不是print("Hello?World"),今天,讓我們一起來開啟探索print()的奇妙之旅,從最基礎的打印字符用法到讓它跳舞唱歌——動態(tài)顯示,讓我們一步步解鎖print()的各種技能吧,需要的朋友可以參考下
    2024-03-03

最新評論