python把數(shù)據(jù)框寫入MySQL的方法
背景:
下文利用上海市2016年9月1日公共交通卡刷卡數(shù)據(jù)
如圖:
想做一下上海市通勤數(shù)據(jù)挖掘,由于源文件有800多兆,用python讀取起來很慢很卡,于是想導入數(shù)據(jù)庫MySQL里面處理,以前一般是打開workbench
可視化操作導入數(shù)據(jù)庫,這次想換成代碼實現(xiàn),于是琢磨著如何把這個csv文件用python導進去。
一般的,python把數(shù)據(jù)框寫入數(shù)據(jù)庫有兩種方法
利用insert into 命令一條一條插入:
采用這種方法,可以爬一條立馬向數(shù)據(jù)庫里面插入一條數(shù)據(jù),整體銜接好,不怕大量數(shù)據(jù)一次性塞進數(shù)據(jù)庫導致?lián)矶拢?/p>
pd.io.sql.to_sql( )整個數(shù)據(jù)框以追加的方式整體復制進去
今天主要研究第二種方法
實現(xiàn)代碼:
import pandas as pd ?#導入數(shù)據(jù)分析模塊 import pymysql #導入數(shù)據(jù)庫接口模塊 from sqlalchemy import create_engine data=pd.read_csv(r"D:\數(shù)據(jù)\yikatongchengkeshuakashuju\201608\SPTCC20160901.csv",engine='python',header=None) #讀取數(shù)據(jù)encoding='mbcs', data.columns=["卡號","日期","時間","站點","交通方式","費用","是否有優(yōu)惠"] #由于原csv文件沒有表頭,這里添加表頭 #print(data.head()) #測試 db=pymysql.connect("localhost","root","123456","metro_sh",charset="utf8") #鏈接數(shù)據(jù)庫metro_sh cursor=db.cursor() #獲取游標 cursor.execute("drop table if exists metro_sh_20160901") #以重新寫入的方式導入數(shù)據(jù)表 connect=create_engine("mysql+pymysql://root:123456@localhost:3306/metro_sh?charset=utf8") pd.io.sql.to_sql(data,"metro_sh_20160901",connect,schema="metro_sh",index=False,if_exists="append")
結果截圖:
代碼解讀:
create_engine( )參數(shù)說明:
create_engine(mysql+mysqldb://用戶名:密碼@localhost:端口/數(shù)據(jù)庫名?編碼)
設置數(shù)據(jù)庫的編碼方式的時候最好與之前pd.read_csv()中的encoding參數(shù)一致
pd.io.sql.to_sql( )參數(shù)說明:
(數(shù)據(jù)框, ‘表名’, con=連接鍵, schema=‘數(shù)據(jù)庫名’, if_exists=‘操作方式’)
操作方式有append、fail、replace
append
:如果表存在,則將數(shù)據(jù)添加到這個表的后面fail
:如果表存在就不寫入replace
:如果存在表,刪了,覆蓋
該方法有一個缺點:
該方法整體性好,內存消耗大,如果內存大可以一試
到此這篇關于如何讓python把數(shù)據(jù)框寫入MySQL的文章就介紹到這了,更多相關python把數(shù)據(jù)框寫入MySQL內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
pytorch更新tensor中指定index位置的值scatter_add_問題
這篇文章主要介紹了pytorch更新tensor中指定index位置的值scatter_add_問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2023-06-06關于Django使用 django-celery-beat動態(tài)添加定時任務的方法
本文給大家介紹Django使用 django-celery-beat動態(tài)添加定時任務的方法,安裝對應的是celery版本,文中給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友參考下吧2021-10-10