Python批量刪除mysql中千萬(wàn)級(jí)大量數(shù)據(jù)的腳本分享
場(chǎng)景描述
線上mysql數(shù)據(jù)庫(kù)里面有張表保存有每天的統(tǒng)計(jì)結(jié)果,每天有1千多萬(wàn)條,這是我們意想不到的,統(tǒng)計(jì)結(jié)果咋有這么多。運(yùn)維找過(guò)來(lái),磁盤(pán)占了200G,最后問(wèn)了運(yùn)營(yíng),可以只保留最近3天的,前面的數(shù)據(jù),只能刪了。刪,怎么刪?
因?yàn)檫@是線上數(shù)據(jù)庫(kù),里面存放有很多其它數(shù)據(jù)表,如果直接刪除這張表的數(shù)據(jù),肯定不行,可能會(huì)對(duì)其它表有影響。嘗試每次只刪除一天的數(shù)據(jù),還是卡頓的厲害,沒(méi)辦法,寫(xiě)個(gè)Python腳本批量刪除吧。
具體思路是:
- 每次只刪除一天的數(shù)據(jù);
- 刪除一天的數(shù)據(jù),每次刪除50000條;
- 一天的數(shù)據(jù)刪除完,開(kāi)始刪除下一天的數(shù)據(jù);
Python代碼
# -*-coding:utf-8 -*- import sys # 這是我們內(nèi)部封裝的Python Module sys.path.append('/var/lib/hadoop-hdfs/scripts/python_module2') import keguang.commons as commons import keguang.timedef as timedef import keguang.sql.mysqlclient as mysql def run(starttime, endtime, regx): tb_name = 'statistic_ad_image_final_count' days = timedef.getDays(starttime,endtime,regx) # 遍歷刪除所有天的數(shù)據(jù) for day in days: print '%s 數(shù)據(jù)刪除開(kāi)始'%(day) mclient = getConn() sql = ''' select 1 from %s where date = '%s' limit 1 '''%(tb_name, day) print sql result = mclient.query(sql) # 如果查詢(xún)到了這一天的數(shù)據(jù),繼續(xù)刪除 while result is not (): sql = 'delete from %s where date = "%s" limit 50000'%(tb_name, day) print sql mclient.execute(sql) sql = ''' select 1 from %s where date = '%s' limit 1 '''%(tb_name, day) print sql result = mclient.query(sql) print '%s 數(shù)據(jù)刪除完成'%(day) mclient.close() # 返回mysql 連接 def getConn(): return mysql.MysqlClient(host = '0.0.0.0', user = 'test', passwd = 'test', db= 'statistic') if __name__ == '__main__': regx = '%Y-%m-%d' yesday = timedef.getYes(regx, -1) starttime = '2019-08-17' endtime ='2019-08-30' run(starttime, endtime, regx)
以上就是Python批量刪除mysql中千萬(wàn)級(jí)大量數(shù)據(jù)的腳本的詳細(xì)內(nèi)容,更多關(guān)于python 刪除MySQL數(shù)據(jù)的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
- MyBatis批量插入/修改/刪除MySql數(shù)據(jù)
- mysql利用mysqlbinlog命令恢復(fù)誤刪除數(shù)據(jù)的實(shí)現(xiàn)
- mysql5.7.33誤刪除ibdata文件找回?cái)?shù)據(jù)的方法
- mysql數(shù)據(jù)庫(kù)刪除重復(fù)數(shù)據(jù)只保留一條方法實(shí)例
- mysql 大表批量刪除大量數(shù)據(jù)的實(shí)現(xiàn)方法
- 淺談為什么MySQL不建議delete刪除數(shù)據(jù)
- Mysql刪除數(shù)據(jù)以及數(shù)據(jù)表的方法實(shí)例
- MySQL刪除數(shù)據(jù),表文件大小依然沒(méi)變的原因
- MySQL 快速刪除大量數(shù)據(jù)(千萬(wàn)級(jí)別)的幾種實(shí)踐方案詳解
- MySQL Delete 刪數(shù)據(jù)后磁盤(pán)空間未釋放的原因
相關(guān)文章
python產(chǎn)生模擬數(shù)據(jù)faker庫(kù)的使用詳解
這篇文章主要介紹了python產(chǎn)生模擬數(shù)據(jù)faker庫(kù)的使用詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-11-11opencv中顏色空間轉(zhuǎn)換函數(shù)cv2.cvtColor()使用
本文主要介紹了opencv中顏色空間轉(zhuǎn)換函數(shù)cv2.cvtColor()使用,文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-05-05pandas.dataframe中根據(jù)條件獲取元素所在的位置方法(索引)
今天小編就為大家分享一篇pandas.dataframe中根據(jù)條件獲取元素所在的位置方法(索引),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-06-06pandas實(shí)現(xiàn)按照多列排序-ascending
這篇文章主要介紹了pandas實(shí)現(xiàn)按照多列排序-ascending,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-05-05Python實(shí)現(xiàn)基于標(biāo)記的分水嶺分割算法
分水嶺技術(shù)是一種眾所周知的分割算法,特別適用于提取圖片中的相鄰或重疊對(duì)象。本文將用Python實(shí)現(xiàn)基于標(biāo)記的分水嶺分割算法,感興趣的可以了解一下2022-07-07Python3爬蟲(chóng)爬取百姓網(wǎng)列表并保存為json功能示例【基于request、lxml和json模塊】
這篇文章主要介紹了Python3爬蟲(chóng)爬取百姓網(wǎng)列表并保存為json功能,涉及Python基于request、lxml和json模塊的Request請(qǐng)求與響應(yīng)數(shù)據(jù)處理相關(guān)操作技巧,需要的朋友可以參考下2018-12-12python?random庫(kù)的簡(jiǎn)單使用demo
這篇文章主要為大家介紹了python?random庫(kù)的簡(jiǎn)單使用demo,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-03-03