深入理解Java中HashCode方法
關(guān)于hashCode,維基百科中:
In the Java programming language, every class implicitly or explicitly provides a hashCode() method, which digests the data stored in an instance of the class into a single hash value (a 32-bit signed integer).
hashCode就是根據(jù)存儲在一個對象實例中的所有數(shù)據(jù),提取出一個32位的整數(shù),該整數(shù)的目的是用來標(biāo)示該實例的唯一性。有點類似于MD5碼,每個文件都能通過MD5算法生成一個唯一的MD5碼。不過,Java中的hashCode并沒有真正的實現(xiàn)為每個對象生成一個唯一的hashCode,還是會有一定的重復(fù)幾率。
先來看看Object類,我們知道,Object類是java程序中所有類的直接或間接父類,處于類層次的最高點。在Object類里定義了很多我們常見的方法,包括我們要講的hashCode方法,如下
public final native Class<?> getClass(); public native int hashCode(); public boolean equals(Object obj) { return (this == obj); } public String toString() { return getClass().getName() + "@" + Integer.toHexString(hashCode()); }
注意到hashCode方法前面有個native的修飾符,這表示hashCode方法是由非java語言實現(xiàn)的,具體的方法實現(xiàn)在外部,返回內(nèi)存對象的地址。
在java的很多類中都會重寫equals和hashCode方法,這是為什么呢?最常見的String類,比如我定義兩個字符相同的字符串,那么對它們進(jìn)行比較時,我想要的結(jié)果應(yīng)該是相等的,如果你不重寫equals和hashCode方法,他們肯定是不會相等的,因為兩個對象的內(nèi)存地址不一樣。
public int hashCode() { int h = hash; if (h == 0) { int off = offset; char val[] = value; int len = count; for (int i = 0; i < len; i++) { h = 31*h + val[off++]; } hash = h; } return h; }
其實這段代碼是這個數(shù)學(xué)表達(dá)式的實現(xiàn)
s[0]*31^(n-1) + s[1]*31^(n-2) + … + s[n-1]
s[i]是string的第i個字符,n是String的長度。那為什么這里用31,而不是其它數(shù)呢?《Effective Java》是這樣說的:之所以選擇31,是因為它是個奇素數(shù),如果乘數(shù)是偶數(shù),并且乘法溢出的話,信息就會丟失,因為與2相乘等價于移位運算。使用素數(shù)的好處并不是很明顯,但是習(xí)慣上都使用素數(shù)來計算散列結(jié)果。31有個很好的特性,就是用移位和減法來代替乘法,可以得到更好的性能:31*i==(i<<5)-i。現(xiàn)在的VM可以自動完成這種優(yōu)化。
可以看到,String類是用它的value值作為參數(shù)來計算hashCode的,也就是說,相同的value就一定會有相同的hashCode值。這點也很容易理解,因為value值相同,那么用equals比較也是相等的,equals方法比較相等,則hashCode一定相等。反過來不一定成立。它不保證相同的hashCode一定有相同的對象。
一個好的hash函數(shù)應(yīng)該是這樣的:為不相同的對象產(chǎn)生不相等的hashCode。
在理想情況下,hash函數(shù)應(yīng)該把集合中不相等的實例均勻分布到所有可能的hashCode上,要想達(dá)到這種理想情形是非常困難的,至少java沒有達(dá)到。因為我們可以看到,hashCode是非隨機(jī)生成的,它有一定的規(guī)律,就是上面的數(shù)學(xué)等式,我們可以構(gòu)造一些具有相同hashCode但value值不一樣的,比如說:Aa和BB的hashCode是一樣的。
如下代碼:
public class Main { public static void main(String[] args) { Main m = new Main(); System.out.println(m); System.out.println(Integer.toHexString(m.hashCode())); String a = "Aa"; String b = "BB"; System.out.println(a.hashCode()); System.out.println(b.hashCode()); } }
輸出結(jié)果:
Main@2a139a55 2a139a55 2112 2112
一般在重寫equal函數(shù)時,也要重寫hashCode函數(shù),這是為什么呢?
來看看這個例子,讓我們創(chuàng)建一個簡單的類Employee
public class Employee { private Integer id; private String firstname; private String lastName; private String department; public Integer getId() { return id; } public void setId(Integer id) { this.id = id; } public String getFirstname() { return firstname; } public void setFirstname(String firstname) { this.firstname = firstname; } public String getLastName() { return lastName; } public void setLastName(String lastName) { this.lastName = lastName; } public String getDepartment() { return department; } public void setDepartment(String department) { this.department = department; } }
上面的Employee類只是有一些非?;A(chǔ)的屬性和getter、setter.現(xiàn)在來考慮一個你需要比較兩個employee的情形。
public class EqualsTest { public static void main(String[] args) { Employee e1 = new Employee(); Employee e2 = new Employee(); e1.setId(100); e2.setId(100); //Prints false in console System.out.println(e1.equals(e2)); } }
毫無疑問,上面的程序?qū)⑤敵鰂alse,但是,事實上上面兩個對象代表的是通過一個employee。真正的商業(yè)邏輯希望我們返回true。
為了達(dá)到這個目的,我們需要重寫equals方法。
public boolean equals(Object o) { if(o == null) { return false; } if (o == this) { return true; } if (getClass() != o.getClass()) { return false; } Employee e = (Employee) o; return (this.getId() == e.getId()); }
在上面的類中添加這個方法,EauqlsTest將會輸出true。
So are we done?沒有,讓我們換一種測試方法來看看。
import java.util.HashSet; import java.util.Set; public class EqualsTest { public static void main(String[] args) { Employee e1 = new Employee(); Employee e2 = new Employee(); e1.setId(100); e2.setId(100); //Prints 'true' System.out.println(e1.equals(e2)); Set<Employee> employees = new HashSet<Employee>(); employees.add(e1); employees.add(e2); //Prints two objects System.out.println(employees); }
上面的程序輸出的結(jié)果是兩個。如果兩個employee對象equals返回true,Set中應(yīng)該只存儲一個對象才對,問題在哪里呢?
我們忘掉了第二個重要的方法hashCode()。就像JDK的Javadoc中所說的一樣,如果重寫equals()方法必須要重寫hashCode()方法。我們加上下面這個方法,程序?qū)?zhí)行正確。
@Override public int hashCode() { final int PRIME = 31; int result = 1; result = PRIME * result + getId(); return result; }
需要注意記住的事情
盡量保證使用對象的同一個屬性來生成hashCode()和equals()兩個方法。在我們的案例中,我們使用員工id。
eqauls方法必須保證一致(如果對象沒有被修改,equals應(yīng)該返回相同的值)
任何時候只要a.equals(b),那么a.hashCode()必須和b.hashCode()相等。
兩者必須同時重寫。
總結(jié)
以上就是本文關(guān)于深入理解Java中HashCode方法的全部內(nèi)容,希望對大家有所幫助。感興趣的朋友可以繼續(xù)參閱本站其他相關(guān)專題,如有不足之處,歡迎留言指出。感謝朋友們對本站的支持!
相關(guān)文章
Spring整合SpringMVC + Mybatis基礎(chǔ)框架的配置文件詳解
這篇文章主要介紹了Spring整合SpringMVC + Mybatis基礎(chǔ)框架的配置文件,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-02-02Java?Spring?AOP源碼解析之事務(wù)實現(xiàn)原理
這篇文章主要為大家介紹了Java?Spring?AOP事務(wù)實現(xiàn)原理,具有一定的參考價值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來幫助2022-01-01Springboot實現(xiàn)對配置文件中的明文密碼加密詳解
我們在SpringBoot項目當(dāng)中,會把數(shù)據(jù)庫的用戶名密碼等配置直接放在yaml或者properties文件中,這樣維護(hù)數(shù)據(jù)庫的密碼等敏感信息顯然是有一定風(fēng)險的。所以本文為大家整理了對配置文件中的明文密碼加密的方法,希望對大家有所幫助2023-03-03Springboot Mybatis-Plus數(shù)據(jù)庫單元測試實戰(zhàn)(三種方式)
這篇文章主要介紹了Springboot Mybatis-Plus數(shù)據(jù)庫單元測試實戰(zhàn)(三種方式),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-12-12