Java中使用HashMap改進(jìn)查找性能的步驟
Java中,HashMap,其實(shí)就是鍵值對。一個Key,對應(yīng)一個值;寫數(shù)據(jù)時,指定Key寫對應(yīng)值;讀取時憑Key找到相應(yīng)值。感覺就跟Redis差不多。
// 創(chuàng)建 HashMap 對象 Sites HashMap<Integer, String> Sites = new HashMap<Integer, String>(); // 添加鍵值對 Sites.put(1, "Google"); Sites.put(2, "Runoob"); Sites.put(3, "Taobao"); Sites.put(4, "Zhihu"); //讀取 String val = Sites.get(1);//得到Google
為什么說可以用HashMap來改進(jìn)性能呢?原因不是說HashMap這種數(shù)據(jù)結(jié)構(gòu)存儲性能就比其他的,比如數(shù)組,集合先進(jìn)多少。我主要看中的,是在知道Key的情況下,找到相應(yīng)值得速度非常快。如果是用數(shù)組,最簡單的,用循環(huán);講究一點(diǎn),排好序,用折半查找(二分查找)。都比不上用Key在HashMap里直接讀取。不知道為什么HashMap在查找方面為啥這么快,估計(jì)是存儲結(jié)構(gòu),使用了啥樹,并為Key建立了索引。這是另外一個課題,以后再了解。昨天,我只是利用了這個特性,將運(yùn)行幾個小時都沒結(jié)束的問題,只耗費(fèi)了十幾秒。
問題如下:
有25萬條記錄,每條記錄含經(jīng)緯度;存在不同記錄坐標(biāo)相同情況?,F(xiàn)在想將坐標(biāo)相同的記錄歸并在一起。
如果數(shù)據(jù)是保存在數(shù)據(jù)庫里,那么用SQL進(jìn)行坐標(biāo)分組,應(yīng)該能解決問題。然而并沒有數(shù)據(jù)庫,數(shù)據(jù)是從gdb文件里讀出來的。
好吧,將數(shù)據(jù)保存到數(shù)組里,再新建一個集合;然后循環(huán)數(shù)組,與新集合中的記錄逐個比較,坐標(biāo)相同就歸并到新集合,不同就插入新集合。最簡單了。結(jié)果2個小時過去了,還沒有結(jié)束的跡象。
想想也對,新集合越來越大,比較的次數(shù)也越來越多,仿佛棋盤里的大米一樣,每格的大米數(shù)量是前一格的兩倍;最后即使是整個國家糧庫的大米都放進(jìn)去,都填不滿整個棋盤。
將25萬條記錄先排好序再處理?單是排序就忙死了,不行吧。
將25萬條記錄先保存到數(shù)據(jù)庫里,再分組?應(yīng)該也可以,但總覺得笨了一些,而且速度應(yīng)該也是以分鐘算的。
最后決定用HashMap來做這個新集合。
如上所述,HashMap按照Key來寫入或讀取值。關(guān)鍵是這個Key怎么得來。上面的例子,是寫代碼的人自己給出了一些字符作為Key。而在我們項(xiàng)目中,可以用經(jīng)緯度之和的哈希值來作為Key。哈希值相同的,就認(rèn)為是經(jīng)緯度相同,只需要判斷新集合中,是否存在這個Key對應(yīng)的元素就可以了,根本無須循環(huán)比較。
由于存在兩個不同的經(jīng)緯度加起來,結(jié)果是一樣的可能性,因此先將經(jīng)度 乘以1000,再加緯度,這樣基本杜絕沖突的機(jī)會。
代碼如下:
private HashMap<Long,SimpleItem> recGeo(HashMap<Long, SimpleItem> map,String geo,int j){ /* 將相同坐標(biāo)的記錄合成一條 HashMap<Long, SimpleItem> map, 新集合 String geo, 坐標(biāo)字符串 int j 記錄ID */ try { Point p = (Point)reader.read(geo); /* 計(jì)算哈希值 因?yàn)槿绻捎醚h(huán)來比較,數(shù)據(jù)量太大,速度太慢了 為避免不同坐標(biāo)出現(xiàn)經(jīng)度+緯度結(jié)果相同的情況,將經(jīng)度 * 1000再相加 */ //計(jì)算Key long k = Long.valueOf(Double.doubleToLongBits(p.getX() * 1000 + p.getY())).hashCode(); SimpleItem si = map.get(k); if(si != null){//新集合中該Key對應(yīng)元素已存在,應(yīng)該是相同坐標(biāo)的記錄 si.getPointers().add(j);//歸并 } else {//否則插入 si = new SimpleItem(); si.setGeo(geo); List<Integer> pointers = new ArrayList(); pointers.add(j); si.setPointers(pointers); map.put(k,si); } } catch (ParseException e) { e.printStackTrace(); } return map; } private static GeometryFactory geometryFactory = JTSFactoryFinder.getGeometryFactory( null ); private static WKTReader reader = new WKTReader( geometryFactory ); class SimpleItem{ private Point geo; private List<Integer> pointers; public Point getGeo() { return geo; } public void setGeo(String geo) { try { this.geo = (Point)reader.read(geo); } catch (ParseException e) { e.printStackTrace(); } } public List<Integer> getPointers() { return pointers; } public void setPointers(List<Integer> pointers) { this.pointers = pointers; } }
短短幾秒,新集合即得到5萬個元素。
以上就是Java中使用HashMap改進(jìn)查找性能的步驟的詳細(xì)內(nèi)容,更多關(guān)于Java HashMap改進(jìn)查找性能的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
SpringBoot實(shí)現(xiàn)接口返回?cái)?shù)據(jù)脫敏的代碼示例
在當(dāng)今的信息化時代,數(shù)據(jù)安全尤為重要,接口返回?cái)?shù)據(jù)脫敏是一種重要的數(shù)據(jù)保護(hù)手段,可以防止敏感信息通過接口返回給客戶端,本文旨在探討如何在SpringBoot應(yīng)用程序中實(shí)現(xiàn)接口返回?cái)?shù)據(jù)脫敏,需要的朋友可以參考下2024-07-07java子類調(diào)用父類的方法中包含子類重寫的實(shí)例方法
在本篇文章里小編給大家整理了關(guān)于java子類調(diào)用父類的方法中包含子類重寫的實(shí)例方法以及相關(guān)知識點(diǎn),需要的朋友們可以學(xué)習(xí)下。2019-09-09迅速掌握J(rèn)ava容器中常用的ArrayList類與Vector類用法
這篇文章主要介紹了Java容器中常用的ArrayList類與Vector類用法,文中只對其最基本的功能給出了示例代碼,需要的朋友可以參考下2015-11-11SpringBoot事件發(fā)布與監(jiān)聽超詳細(xì)講解
今天去官網(wǎng)查看spring boot資料時,在特性中看見了系統(tǒng)的事件及監(jiān)聽章節(jié),所以下面這篇文章主要給大家介紹了關(guān)于SpringBoot事件發(fā)布和監(jiān)聽的相關(guān)資料,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-11-11解析使用jdbc,hibernate處理clob/blob字段的詳解
本篇是對使用jdbc,hibernate處理clob/blob字段進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下2013-05-05基于SpringMVC中的路徑參數(shù)和URL參數(shù)實(shí)例
這篇文章主要介紹了基于SpringMVC中的路徑參數(shù)和URL參數(shù)實(shí)例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-02-02Springboot集成magic-api的詳細(xì)過程
這篇文章主要介紹了Springboot集成magic-api的相關(guān)知識,本文結(jié)合實(shí)例代碼給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2023-06-06