欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python 等分切分?jǐn)?shù)據(jù)及規(guī)則命名的實例代碼

 更新時間:2019年08月16日 16:20:58   作者:Mr-Lin  
這篇文章主要介紹了Python 等分切分?jǐn)?shù)據(jù)及規(guī)則命名的實例代碼,代碼簡單易懂,非常不錯,具有一定的參考借鑒價值,需要的朋友可以參考下

 將一份一億多條數(shù)據(jù)的csv文件等分為10份,代碼如下所示:

import pandas as pd
data = pd.read_csv('C:\\Users\\PycharmProjects\\SplitData\\data\\UserBehavior.csv') # 路徑則根據(jù)個人存放項目文件的習(xí)慣
num = 0
for i in range(1, 11):
start = num
num = num + int(data.shape[0] / 10)
file = data.iloc[start:num,]
file.to_csv("C:\\Users\\PycharmProjects\\SplitData\\newData\\" + str(i) + "_data.csv", index=False) # index=False是不想切分后的文件出現(xiàn)序號

注意:如果此時文件的路徑包含有中文,則必須改成以下的代碼:

import pandas as pd
f = open('C:\\Users\\PycharmProjects\\數(shù)據(jù)切分\\data\\UserBehavior.csv')
data = pd.read_csv(f)
num = 0
for i in range(1, 11):
start = num
num = num + int(data.shape[0] / 10)
file = data.iloc[start:num,]
file.to_csv("C:\\Users\\PycharmProjects\\SplitData\\newData\\" + str(i) + "_data.csv", index=False)

但是使用這種方法調(diào)用文件進(jìn)內(nèi)存,加重了內(nèi)存的負(fù)擔(dān),兩次賦值相當(dāng)于內(nèi)存占用乘2,此方法不建議使用,還是將路徑改為英文名。

總結(jié)

以上所述是小編給大家介紹的Python 等分切分?jǐn)?shù)據(jù)及規(guī)則命名的實例代碼,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復(fù)大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
如果你覺得本文對你有幫助,歡迎轉(zhuǎn)載,煩請注明出處,謝謝!

相關(guān)文章

最新評論