Python寫入MySQL數(shù)據(jù)庫(kù)的三種方式詳解
大家好,Python 讀取數(shù)據(jù)自動(dòng)寫入 MySQL 數(shù)據(jù)庫(kù),這個(gè)需求在工作中是非常普遍的,主要涉及到 python 操作數(shù)據(jù)庫(kù),讀寫更新等,數(shù)據(jù)庫(kù)可能是 mongodb、 es,他們的處理思路都是相似的,只需要將操作數(shù)據(jù)庫(kù)的語(yǔ)法更換即可。
本篇文章會(huì)給大家分享數(shù)據(jù)如何寫入到 mysql,分為兩個(gè)場(chǎng)景,三種方式。
場(chǎng)景一:數(shù)據(jù)不需要頻繁的寫入mysql
使用 navicat 工具的導(dǎo)入向?qū)Чδ堋VС侄喾N文件格式,可以根據(jù)文件的字段自動(dòng)建表,也可以在已有表中插入數(shù)據(jù),非??旖莘奖?。
場(chǎng)景二:數(shù)據(jù)是增量的,需要自動(dòng)化并頻繁寫入mysql
測(cè)試數(shù)據(jù):csv 格式 ,大約 1200萬行
import pandas as pd data = pd.read_csv('./tianchi_mobile_recommend_train_user.csv') data.shape
打印結(jié)果
方式一
python + pymysql 庫(kù)
安裝 pymysql 命令
pip install pymysql
代碼實(shí)現(xiàn):
import pymysql # 數(shù)據(jù)庫(kù)連接信息 conn = pymysql.connect( host='127.0.0.1', user='root', passwd='wangyuqing', db='test01', port = 3306, charset="utf8") # 分塊處理 big_size = 100000 # 分塊遍歷寫入到 mysql with pd.read_csv('./tianchi_mobile_recommend_train_user.csv',chunksize=big_size) as reader: for df in reader: datas = [] print('處理:',len(df)) # print(df) for i ,j in df.iterrows(): data = (j['user_id'],j['item_id'],j['behavior_type'], j['item_category'],j['time']) datas.append(data) _values = ",".join(['%s', ] * 5) sql = """insert into users(user_id,item_id,behavior_type ,item_category,time) values(%s)""" % _values cursor = conn.cursor() cursor.executemany(sql,datas) conn.commit() # 關(guān)閉服務(wù) conn.close() cursor.close() print('存入成功!')
方式二
pandas + sqlalchemy:pandas需要引入sqlalchemy來支持sql,在sqlalchemy的支持下,它可以實(shí)現(xiàn)所有常見數(shù)據(jù)庫(kù)類型的查詢、更新等操作。
代碼實(shí)現(xiàn):
from sqlalchemy import create_engine engine = create_engine('mysql+pymysql://root:wangyuqing@localhost:3306/test01') data = pd.read_csv('./tianchi_mobile_recommend_train_user.csv') data.to_sql('user02',engine,chunksize=100000,index=None) print('存入成功!')
總結(jié)
pymysql 方法用時(shí)12分47秒,耗時(shí)還是比較長(zhǎng)的,代碼量大,而 pandas 僅需五行代碼就實(shí)現(xiàn)了這個(gè)需求,只用了4分鐘左右。
最后補(bǔ)充下,方式一需要提前建表,方式二則不需要。
所以推薦大家使用第二種方式,既方便又效率高。如果還覺得速度慢的小伙伴,可以考慮加入多進(jìn)程、多線程。
最全的三種將數(shù)據(jù)存入到 MySQL 數(shù)據(jù)庫(kù)方法:
- 直接存,利用 navicat 的導(dǎo)入向?qū)Чδ?/li>
- Python pymysql
- Pandas sqlalchemy
到此這篇關(guān)于Python寫入MySQL數(shù)據(jù)庫(kù)的三種方式詳解的文章就介紹到這了,更多相關(guān)Python寫入MySQL內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python 基于selectors庫(kù)實(shí)現(xiàn)文件上傳與下載
這篇文章主要介紹了python 基于selectors庫(kù)實(shí)現(xiàn)文件上傳與下載的示例代碼,幫助大家更好的理解和使用python,感興趣的朋友可以了解下2020-12-12Python 實(shí)現(xiàn)平臺(tái)類游戲添加跳躍功能
這篇文章主要介紹了Python 實(shí)現(xiàn)平臺(tái)類游戲添加跳躍功能,,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-03-03Python利用Bokeh進(jìn)行數(shù)據(jù)可視化的教程分享
Bokeh是Python中的數(shù)據(jù)可視化庫(kù),提供高性能的交互式圖表和繪圖。本文將利用Bokeh繪制一些可視化圖表,文中的示例代碼講解詳細(xì),感興趣的可以了解一下2022-08-08如何使用 Python 中的功能和庫(kù)創(chuàng)建 n-gram的過程
在計(jì)算語(yǔ)言學(xué)中,n-gram 對(duì)于語(yǔ)言處理、上下文和語(yǔ)義分析非常重要,本文將討論如何使用 Python 中的功能和庫(kù)創(chuàng)建 n-gram,感興趣的朋友一起看看吧2023-09-09Python confluent kafka客戶端配置kerberos認(rèn)證流程詳解
這篇文章主要介紹了Python confluent kafka客戶端配置kerberos認(rèn)證流程詳解,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-10-10pandas的唯一值、值計(jì)數(shù)以及成員資格的示例
今天小編就為大家分享一篇pandas的唯一值、值計(jì)數(shù)以及成員資格的示例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-07-07