欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

為什么哈希存取比較快?使用它需要付出什么代價(jià)

 更新時(shí)間:2016年06月16日 12:06:49   作者:Robin  
本文主要介紹為什么哈希存取比較快的原理,有需要的朋友可以參考一下。

  哈希表和哈希函數(shù)是大學(xué)數(shù)據(jù)結(jié)構(gòu)中的課程,實(shí)際開發(fā)中我們經(jīng)常用到Hashtable這種結(jié)構(gòu),當(dāng)遇到鍵-值對存儲(chǔ),采用Hashtable比ArrayList查找的性能高。為什么呢?我們在享受高性能的同時(shí),需要付出什么代價(jià)(這幾天看紅頂商人胡雪巖,經(jīng)典臺詞:在你享受這之前,必須受別人吃不了的苦,忍受別人受不了的屈辱),那么使用Hashtable是否就是一樁無本萬利的買賣呢?就此疑問,做以下分析,希望能拋磚引玉。

一、hash它為什么對于鍵-值查找性能高
  學(xué)過數(shù)據(jù)結(jié)構(gòu)的,都應(yīng)該曉得,線性表和樹中,記錄在結(jié)構(gòu)中的相對位置是隨機(jī)的,記錄和關(guān)鍵字之間不存在明確的關(guān)系,因此在查找記錄的時(shí)候,需要進(jìn)行一系列的關(guān)鍵字比較,這種查找方式建立在比較的基礎(chǔ)之上,在.net中(Array,ArrayList,List)這些集合結(jié)構(gòu)采用了上面的存儲(chǔ)方式。
比如,現(xiàn)在我們有一個(gè)班同學(xué)的數(shù)據(jù),包括姓名,性別,年齡,學(xué)號等。假如數(shù)據(jù)有

姓名 性別 年齡 學(xué)號
張三 15 1
李四 14 2
王五 14 3

假如,我們按照姓名來查找,假設(shè)查找函數(shù)FindByName(string name);
1)查找“張三”
只需在第一行匹配一次。
2)查找"王五"
  在第一行匹配,失敗,
  在第二行匹配,失敗,
  在第三行匹配,成功
上面兩種情況,分別分析了最好的情況,和最壞的情況,那么平均查找次數(shù)應(yīng)該為 (1+3)/2=2次,即平均查找次數(shù)為(記錄總數(shù)+1)的1/2。
盡管有一些優(yōu)化的算法,可以使查找排序效率增高,但是復(fù)雜度會(huì)保持在log2n的范圍之內(nèi)。
如何更更快的進(jìn)行查找呢?我們所期望的效果是一下子就定位到要找記錄的位置之上,這時(shí)候時(shí)間復(fù)雜度為1,查找最快。如果我們事先為每條記錄編一個(gè)序號,然后讓他們按號入位,我們又知道按照什么規(guī)則對這些記錄進(jìn)行編號的話,如果我們再次查找某個(gè)記錄的時(shí)候,只需要先通過規(guī)則計(jì)算出該記錄的編號,然后根據(jù)編號,在記錄的線性隊(duì)列中,就可以輕易的找到記錄了 。
注意,上述的描述包含了兩個(gè)概念,一個(gè)是用于對學(xué)生進(jìn)行編號的規(guī)則,在數(shù)據(jù)結(jié)構(gòu)中,稱之為哈希函數(shù),另外一個(gè)是按照規(guī)則為學(xué)生排列的順序結(jié)構(gòu),稱之為哈希表。
仍以上面的學(xué)生為例,假設(shè)學(xué)號就是規(guī)則,老師手上有一個(gè)規(guī)則表,在排座位的時(shí)候也按照這個(gè)規(guī)則來排序,查找李四,首先該教師會(huì)根據(jù)規(guī)則判斷出,李四的編號為2,就是在座位中的2號位置,直接走過去,“李四,哈哈,你小子,就是在這!”
看看大體流程:
 
從上面的圖中,可以看出哈希表可以描述為兩個(gè)筒子,一個(gè)筒子用來裝記錄的位置編號,另外一個(gè)筒子用來裝記錄,另外存在一套規(guī)則,用來表述記錄與編號之間的聯(lián)系。這個(gè)規(guī)則通常是如何制定的呢?

a)直接定址法:
  我在前一篇文章對GetHashCode()性能比較的問題中談到,對于整形的數(shù)據(jù)GetHashCode()函數(shù)返回的就是整形   本身,其實(shí)就是基于直接定址的方法,比如有一組0-100的數(shù)據(jù),用來表示人的年齡
那么,采用直接定址的方法構(gòu)成的哈希表為:

0 1 2 3 4 5
0歲 1歲 2歲 3歲 4歲 5歲

.....
這樣的一種定址方式,簡單方便,適用于元數(shù)據(jù)能夠用數(shù)字表述或者原數(shù)據(jù)具有鮮明順序關(guān)系的情形。

b)數(shù)字分析法:

  有這樣一組數(shù)據(jù),用于表述一些人的出生日期

75 10 1
75 12 10
75 02 14

分析一下,年和月的第一位數(shù)字基本相同,造成沖突的幾率非常大,而后面三位差別比較大,所以采用后三位

c)平方取中法

  取關(guān)鍵字平方后的中間幾位作為哈希地址

d)折疊法:

  將關(guān)鍵字分割成位數(shù)相同的幾部分,最后一部分位數(shù)可以不相同,然后去這幾部分的疊加和(取出進(jìn)位)作為哈希地址,比如有這樣的數(shù)據(jù)20-1445-4547-3
可以
        5473
+      4454
+        201
=    10128
取出進(jìn)位1,取0128為哈希地址

e)取余法

  取關(guān)鍵字被某個(gè)不大于哈希表表長m的數(shù)p除后所得余數(shù)為哈希地址。H(key)=key MOD p (p<=m)

f)隨機(jī)數(shù)法

  選擇一個(gè)隨機(jī)函數(shù),取關(guān)鍵字的隨機(jī)函數(shù)值為它的哈希地址,即H(key)=random(key) ,其中random為隨機(jī)函數(shù)。通常用于關(guān)鍵字長度不等時(shí)采用此法。

總之,哈希函數(shù)的規(guī)則是:通過某種轉(zhuǎn)換關(guān)系,使關(guān)鍵字適度的分散到指定大小的的順序結(jié)構(gòu)中。越分散,則以后查找的時(shí)間復(fù)雜度越小,空間復(fù)雜度越高。

二、使用hash,我們付出了什么?

  hash是一種典型以空間換時(shí)間的算法,比如原來一個(gè)長度為100的數(shù)組,對其查找,只需要遍歷且匹配相應(yīng)記錄即可,從空間復(fù)雜度上來看,假如數(shù)組存儲(chǔ)的是byte類型數(shù)據(jù),那么該數(shù)組占用100byte空間?,F(xiàn)在我們采用hash算法,我們前面說的hash必須有一個(gè)規(guī)則,約束鍵與存儲(chǔ)位置的關(guān)系,那么就需要一個(gè)固定長度的hash表,此時(shí),仍然是100byte的數(shù)組,假設(shè)我們需要的100byte用來記錄鍵與位置的關(guān)系,那么總的空間為200byte,而且用于記錄規(guī)則的表大小會(huì)根據(jù)規(guī)則,大小可能是不定的,比如在lzw算法中,如果一個(gè)很長的用于記錄像素的byte數(shù)組,用來記錄位置與鍵關(guān)系的表空間,算法推薦為一個(gè)12bit能表述的整數(shù)大小,那么足夠長的像素?cái)?shù)組,如何分散到這樣定長的表中呢,lzw算法采用的是可變長編碼,具體會(huì)在深入介紹lzw算法的時(shí)候介紹。

注:hash表最突出的問題在于沖突,就是兩個(gè)鍵值經(jīng)過哈希函數(shù)計(jì)算出來的索引位置很可能相同,這個(gè)問題,下篇文章會(huì)令作闡述。

注:之所以會(huì)簡單得介紹了hash,是為了更好的學(xué)習(xí)lzw算法,學(xué)習(xí)lzw算法是為了更好的研究gif文件結(jié)構(gòu),最后,我將詳細(xì)的闡述一下gif文件是如何構(gòu)成的,如何高效操作此種類型文件。

以上就是本文的全部內(nèi)容,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • C#端口掃描器的編寫方法

    C#端口掃描器的編寫方法

    這篇文章主要為大家詳細(xì)介紹了C#端口掃描器的編寫方法,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2022-07-07
  • C#服務(wù)端圖片打包下載實(shí)現(xiàn)代碼解析

    C#服務(wù)端圖片打包下載實(shí)現(xiàn)代碼解析

    這篇文章主要介紹了C#服務(wù)端圖片打包下載實(shí)現(xiàn)代碼解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-07-07
  • C#獲取本機(jī)IP地址(ipv4)

    C#獲取本機(jī)IP地址(ipv4)

    本文主要介紹了C#獲取本機(jī)所有IP地址的方法、C#獲取本機(jī)IP地址(ipv4)的方法等。具有很好的參考價(jià)值。下面跟著小編一起來看下吧
    2017-03-03
  • Base64編碼解碼原理及C#編程實(shí)例

    Base64編碼解碼原理及C#編程實(shí)例

    這篇文章主要介紹了Base64編碼解碼原理及C#編程實(shí)例,本文講解了Base64編碼由來、Base64編碼原理、C#編程實(shí)現(xiàn),需要的朋友可以參考下
    2014-10-10
  • C# 使用Tcp/Udp協(xié)議的示例代碼

    C# 使用Tcp/Udp協(xié)議的示例代碼

    這篇文章主要介紹了C# 使用Tcp/Udp協(xié)議的示例,文中代碼非常詳細(xì),幫助大家更好的理解和學(xué)習(xí),感興趣的朋友可以了解下
    2020-08-08
  • C#實(shí)現(xiàn)綁定Combobox的方法

    C#實(shí)現(xiàn)綁定Combobox的方法

    這篇文章主要介紹了C#實(shí)現(xiàn)綁定Combobox的方法,涉及Combobox參數(shù)設(shè)置的相關(guān)技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下
    2015-08-08
  • silverlight實(shí)現(xiàn)圖片局部放大效果的方法

    silverlight實(shí)現(xiàn)圖片局部放大效果的方法

    這篇文章主要介紹了silverlight實(shí)現(xiàn)圖片局部放大效果的方法,結(jié)合實(shí)例形式分析了silverlight針對圖片屬性的相關(guān)操作技巧,需要的朋友可以參考下
    2017-03-03
  • C#程序調(diào)用C++動(dòng)態(tài)庫(dll文件)遇到的坑及解決

    C#程序調(diào)用C++動(dòng)態(tài)庫(dll文件)遇到的坑及解決

    這篇文章主要介紹了C#程序調(diào)用C++動(dòng)態(tài)庫(dll文件)遇到的坑及解決方案,具有很好的參考價(jià)值,希望對大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-08-08
  • C#對Windows服務(wù)組的啟動(dòng)與停止操作

    C#對Windows服務(wù)組的啟動(dòng)與停止操作

    這篇文章主要為大家詳細(xì)介紹了C#對Windows服務(wù)組的啟動(dòng)與停止操作,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-03-03
  • C#如何連接使用Zookeeper

    C#如何連接使用Zookeeper

    Zookeeper作為分布式的服務(wù)框架,雖然是java寫的,但是強(qiáng)大的C#也可以連接使用。而現(xiàn)在主要有兩個(gè)插件可供使用,分別是ZooKeeperNetEx和Zookeeper.Net,個(gè)人推薦使用ZooKeeperNetEx做開發(fā),本文也已介紹ZooKeeperNetEx為主
    2021-06-06

最新評論