Java的基類Object提供了一些方法,其中equals()方法用於判斷兩個對象是否相等,hashCode()方法用於計算對象的哈希碼。equals()和hashCode()都不是final方法,都可以被重寫(overwrite)。
本文介紹了2種方法在使用和重寫時,一些需要注意的問題。
一、equal()方法
Object類中equals()方法實現如下:
1
2
3
|
public
boolean
equals(Object obj) {
return
(
this
== obj);
}
|
通過該實現可以看出,Object類的實現采用了區分度最高的算法,即只要兩個對象不是同一個對象,那么equals()一定返回false。
雖然我們在定義類時,可以重寫equals()方法,但是有一些注意事項;JDK中說明了實現equals()方法應該遵守的約定:
(1)自反性:x.equals(x)必須返回true。
(2)對稱性:x.equals(y)與y.equals(x)的返回值必須相等。
(3)傳遞性:x.equals(y)為true,y.equals(z)也為true,那么x.equals(z)必須為true。
(4)一致性:如果對象x和y在equals()中使用的信息都沒有改變,那么x.equals(y)值始終不變。
(5)非null:x不是null,y為null,則x.equals(y)必須為false。
二、hashCode()方法
1、Object的hashCode()
Object類中hashCode()方法的聲明如下:
1
|
public
native
int
hashCode();
|
可以看出,hashCode()是一個native方法,而且返回值類型是整形;實際上,該native方法將對象在內存中的地址作為哈希碼返回,可以保證不同對象的返回值不同。
與equals()方法類似,hashCode()方法可以被重寫。JDK中對hashCode()方法的作用,以及實現時的注意事項做了說明:
(1)hashCode()在哈希表中起作用,如java.util.HashMap。
(2)如果對象在equals()中使用的信息都沒有改變,那么hashCode()值始終不變。
(3)如果兩個對象使用equals()方法判斷為相等,則hashCode()方法也應該相等。
(4)如果兩個對象使用equals()方法判斷為不相等,則不要求hashCode()也必須不相等;但是開發人員應該認識到,不相等的對象產生不相同的hashCode可以提高哈希表的性能。
2、hashCode()的作用
總的來說,hashCode()在哈希表中起作用,如HashSet、HashMap等。
當我們向哈希表(如HashSet、HashMap等)中添加對象object時,首先調用hashCode()方法計算object的哈希碼,通過哈希碼可以直接定位object在哈希表中的位置(一般是哈希碼對哈希表大小取余)。如果該位置沒有對象,可以直接將object插入該位置;如果該位置有對象(可能有多個,通過鏈表實現),則調用equals()方法比較這些對象與object是否相等,如果相等,則不需要保存object;如果不相等,則將該對象加入到鏈表中。
這也就解釋了為什么equals()相等,則hashCode()必須相等。如果兩個對象equals()相等,則它們在哈希表(如HashSet、HashMap等)中只應該出現一次;如果hashCode()不相等,那么它們會被散列到哈希表的不同位置,哈希表中出現了不止一次。
實際上,在JVM中,加載的對象在內存中包括三部分:對象頭、實例數據、填充。其中,對象頭包括指向對象所屬類型的指針和MarkWord,而MarkWord中除了包含對象的GC分代年齡信息、加鎖狀態信息外,還包括了對象的hashcode;對象實例數據是對象真正存儲的有效信息;填充部分僅起到占位符的作用, 原因是HotSpot要求對象起始地址必須是8字節的整數倍。