python:HDF和CSV存儲(chǔ)優(yōu)劣對(duì)比分析
小數(shù)據(jù)用csv,大數(shù)據(jù)用h5
結(jié)論1:幾百KB以上的數(shù)據(jù)都用h5比較好
結(jié)論2:幾KB的數(shù)據(jù)h5反而很慢
程序
import pandas as pd import numpy as np from wja.wja_tool import test_time as tt from wja import wja_tool as tool df = tool.generate_sampleDF(row, col) tt().run() df.to_csv('try.csv') tt().end() tt().run() df.to_hdf('try.h5','df',mode='w') tt().end() tt().run() df1 = pd.read_csv('try.csv') tt().end() tt().run() df2 = pd.read_hdf('try.h5') tt().end()
對(duì)比1:數(shù)據(jù)10*1
df = tool.generate_sampleDF(10,1)
# csv保存 # hdf保存 # csv讀取 # hdf讀取 程序用時(shí):0.015 程序用時(shí):0.9985 程序用時(shí):0.009 程序用時(shí):0.0369
對(duì)比2:數(shù)據(jù)100*10
df = tool.generate_sampleDF(100,10)
# csv保存 # hdf保存 # csv讀取 # hdf讀取 程序用時(shí):0.017 程序用時(shí):1.1016 程序用時(shí):0.01 程序用時(shí):0.013
對(duì)比3:數(shù)據(jù)1000*100
df = tool.generate_sampleDF(1000,100)
# csv保存 # hdf保存 # csv讀取 # hdf讀取 程序用時(shí):0.2383 程序用時(shí):1.0308 程序用時(shí):0.0499 程序用時(shí):0.016
對(duì)比4:數(shù)據(jù)10000*100
df = tool.generate_sampleDF(10000,100)
# csv保存 # hdf保存 # csv讀取 # hdf讀取 程序用時(shí):2.0895 程序用時(shí):1.0073 程序用時(shí):0.4055 程序用時(shí):0.0169
對(duì)比5:數(shù)據(jù)10000*1000
# csv保存 # hdf保存 # csv讀取 # hdf讀取 df = tool.generate_sampleDF(10000,1000)
# csv保存 # hdf保存 # csv讀取 # hdf讀取 程序用時(shí):23.5693 程序用時(shí):2.2057 程序用時(shí):3.3697 程序用時(shí):0.0619
補(bǔ)充知識(shí):python:n個(gè)點(diǎn)m條邊有權(quán)無向圖
n個(gè)點(diǎn):有個(gè)位置
m條邊:兩點(diǎn)之間存在m條邊有權(quán)值
有權(quán):每條邊代表一個(gè)數(shù)值
無向:沒有規(guī)定行進(jìn)方向
規(guī)定:
1、兩點(diǎn)之間的行進(jìn)路線,最終權(quán)值為所經(jīng)過的邊的權(quán)值的最大值
2、兩點(diǎn)之間走法不止一個(gè),最終取最小值為最終走法
問:
兩點(diǎn)之間的最終權(quán)值為多少
如上圖,我們可以將其寫為列表形式,前兩位是從小到大的的兩個(gè)點(diǎn),最后一個(gè)代表權(quán)值,如
[1, 2, 2] 代表1和2之間的權(quán)值是2,以此類推
n,m = 5, 10 road = [[1, 2, 2], [1, 3, 3], [1, 4, 7], [1, 5, 2], [2, 3, 4], [2, 4, 9], [2, 5, 5], [3, 4, 4], [3, 5, 5], [4, 5, 3]] def hold(list1, list2): jiaoji = list(set(list1)&set(list2)) need = [i for i in set(list1+list2) if i not in jiaoji] need.sort() return need def get(road): option = {} for i in range (m): option[(road[i][0],road[i][1])] = [road[i][2]] for i in range (m): for j in range(i+1,m): dot = hold(road[i][:2], road[j][:2]) if len(dot)==2: if (dot[0],dot[1]) in option.keys(): option[(dot[0],dot[1])].append(max([road[i][2],road[j][2]])) else: option[(dot[0],dot[1])] = [] option[(dot[0],dot[1])].append(max([road[i][2],road[j][2]])) road_new = [] for i in option.items(): road_new.append(list(i[0])+[min(i[1])]) if road==road_new: print(road_new) return road_new return get(road_new)
輸出結(jié)果
所有可能的走法如下,并且最后一位輸出最短的權(quán)值路徑。
例如 [2, 3, 3]:代表 從2走到3最短的權(quán)值路徑是3,對(duì)應(yīng)路徑從圖中可以到是2-1-3
例如 [3, 5, 3]:代表 從3走到5最短的權(quán)值路徑是3,對(duì)應(yīng)路徑從圖中可以到是3-1-5
[[1, 2, 2], [1, 3, 3], [1, 4, 3], [1, 5, 2], [2, 3, 3],
[2, 4, 3], [2, 5, 2], [3, 4, 3], [3, 5, 3], [4, 5, 3]]
以上這篇python:HDF和CSV存儲(chǔ)優(yōu)劣對(duì)比分析就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
PyQt5+QtChart實(shí)現(xiàn)繪制曲線圖
QChart是一個(gè)QGraphicScene中可以顯示的QGraphicsWidget。本文將利用QtChart實(shí)現(xiàn)曲線圖的繪制,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以了解一下2022-12-12Python實(shí)現(xiàn)提取XML內(nèi)容并保存到Excel中的方法
這篇文章主要介紹了Python實(shí)現(xiàn)提取XML內(nèi)容并保存到Excel中的方法,涉及Python針對(duì)xml文件的讀取、解析以及Excel文件的寫入、保存等相關(guān)操作技巧,需要的朋友可以參考下2018-09-09python自動(dòng)化UI工具發(fā)送QQ消息的實(shí)例
今天小編就為大家分享一篇python自動(dòng)化UI工具發(fā)送QQ消息的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-08-08Python實(shí)現(xiàn)微信中找回好友、群聊用戶撤回的消息功能示例
這篇文章主要介紹了Python實(shí)現(xiàn)微信中找回好友、群聊用戶撤回的消息功能,結(jié)合實(shí)例形式分析了Python基于微信itchat模塊實(shí)現(xiàn)針對(duì)撤回消息的查看功能相關(guān)操作技巧,需要的朋友可以參考下2019-08-08python實(shí)現(xiàn)學(xué)生信息管理系統(tǒng)
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)學(xué)生信息管理系統(tǒng),文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-03-03Python?matplotlib中更換畫布背景顏色的3種方法
這篇文章主要給大家介紹了關(guān)于Python?matplotlib中更換畫布背景顏色的3種方法,在Matplotlib中,我們可以使用set_facecolor()方法來設(shè)置背景顏色,文中通過圖文以及代碼介紹的非常詳細(xì),需要的朋友可以參考下2023-11-11