集合
集合與數組
數組(可以存儲基本數據類型)是用來存現對象的一種容器,但是數組的長度固定,不適合在對象數量未知的情況下使用。
集合(只能存儲對象,對象類型可以不一樣)的長度可變,可在多數情況下使用。
注:數組我在前面的博客講了大家可以看下
集合中接口和類的關系
Collection接口是集合類的根接口,Java中沒有提供這個接口的直接的實現類。但是卻讓其被繼承產生了兩個接口,就是Set和List。Set中不能包含重復的元素。List是一個有序的集合,可以包含重復的元素,提供了按索引訪問的方式。
Map是Java.util包中的另一個接口,它和Collection接口沒有關系,是相互獨立的,但是都屬於集合類的一部分。Map包含了key-value對。Map不能包含重復的key,但是可以包含相同的value。
Iterator所有的集合類,都實現了Iterator接口,這是一個用於遍歷集合中元素的接口,主要包含以下三種方法:
1.hasNext()是否還有下一個元素。
2.next()返回下一個元素。
3.remove()刪除當前元素。
層次圖
圖一這個比較簡單
圖二完整
list,set,map對比
接口 | 子接口 | 是否有序 | 是否允許元素重復 |
---|---|---|---|
Collection | 否 | ||
List | ArrayList | 否 | 是 |
LinkedList | 否 | 是 | |
Vector | 否 | 是 | |
Set | AbstractSet | 否 | 否 |
HashSet | 否 | 否 | |
TreeSet | 是(用二叉排序樹) | 否 | |
Map | AbstractMap | 否 | 使用key-value來映射和存儲數據,key必須唯一,value可以重復 |
HashMap | 否 | ||
TreeMap | 是(用二叉排序樹) | 使用key-value來映射和存儲數據,key必須唯一,value可以重復 |
list(有序、可重復)
List里存放的對象是有序的,同時也是可以重復的,List關注的是索引,擁有一系列和索引相關的方法,查詢速度快。因為往list集合里插入或刪除數據時,會伴隨着后面數據的移動,所有插入刪除數據速度慢。
ArrayList
ArrayList是基於數組的,在初始化ArrayList時,會構建空數組(Object[] elementData={})。ArrayList是一個無序的,它是按照添加的先后順序排列,當然,他也提供了sort方法,如果需要對ArrayList進行排序,只需要調用這個方法,提供Comparator比較器即可
add操作:
1)如果是第一次添加元素,數組的長度被擴容到默認的capacity,也就是10.
2) 當發覺同時添加一個或者是多個元素,數組長度不夠時,就擴容,這里有兩種情況:
只添加一個元素,例如:原來數組的capacity為10,size已經為10,不能再添加了。需要擴容,新的capacity=old capacity+old capacity>>1=10+10/2=15.即新的容量為15。
當同時添加多個元素時,原來數組的capacity為10,size為10,當同時添加6個元素時。它需要的min capacity為16,而按照capacity=old capacity+old capacity>>1=10+10/2=15。new capacity小於min capacity,則取min capacity。
對於添加,如果不指定下標,就直接添加到數組后面,不涉及元素的移動,如果要添加到某個特定的位置,那需要將這個位置開始的元素往后挪一個位置,然后再對這個位置設置。
Remove操作:
Remove提供兩種,按照下標和value。
1)remove(int index):首先需要檢查Index是否在合理的范圍內。其次再調用System.arraycopy將index之后的元素向前移動。
2)remove(Object o):首先遍歷數組,獲取第一個相同的元素,獲取該元素的下標。其次再調用System.arraycopy將index之后的元素向前移動。
Get操作:
這個比較簡單,直接對數組進行操作即可。
LinkedList
LinkedList是基於鏈表的,它是一個雙向鏈表,每個節點維護了一個prev和next指針。同時對於這個鏈表,維護了first和last指針,first指向第一個元素,last指向最后一個元素。LinkedList是一個無序的鏈表,按照插入的先后順序排序,不提供sort方法對內部元素排序。
Add元素:
LinkedList提供了幾個添加元素的方法:addFirst、addLast、addAll、add等,時間復雜度為O(1)。
Remove元素:
LinkedList提供了幾個移除元素的方法:removeFirst、removeLast、removeFirstOccurrence、remove等,時間復雜度為O(1)。
Get元素:
根據給定的下標index,判斷它first節點、last直接距離,如果index<size(數組元素個數)/2,就從first開始。如果大於,就從last開始。這個和我們平常思維不太一樣,也許按照我們的習慣,從first開始。這也算是一點小心的優化吧。
遍歷
在類集中提供了以下四種的常見輸出方式:
1)Iterator:迭代輸出,是使用最多的輸出方式。
2)ListIterator:是Iterator的子接口,專門用於輸出List中的內容。
3)foreach輸出:JDK1.5之后提供的新功能,可以輸出數組或集合。
4)for循環
代碼示例如下:
for的形式:for(int i=0;i<arr.size();i++){...}
foreach的形式: for(int i:arr){...}
iterator的形式:
Iterator it = arr.iterator();
while(it.hasNext()){ object o =it.next(); ...}
Set(無序、不能重復)
Set里存放的對象是無序,不能重復的,集合中的對象不按特定的方式排序,只是簡單地把對象加入集合中。
HashSet
HashSet是基於HashMap來實現的,操作很簡單,更像是對HashMap做了一次“封裝”,而且只使用了HashMap的key來實現各種特性,而HashMap的value始終都是PRESENT。
HashSet不允許重復(HashMap的key不允許重復,如果出現重復就覆蓋),允許null值,非線程安全。
構造方法
**HashSet() **
構造一個新的空 set,其底層 HashMap 實例的默認初始容量是 16,加載因子是 0.75。
**HashSet(Collection<? extends E> c) **
構造一個包含指定 collection 中的元素的新 set。
**HashSet(int initialCapacity) **
構造一個新的空 set,其底層 HashMap 實例具有指定的初始容量和默認的加載因子(0.75)。
HashSet(int initialCapacity, float loadFactor)
構造一個新的空 set,其底層 HashMap 實例具有指定的初始容量和指定的加載因子。
方法
boolean add(E e) **
如果此 set 中尚未包含指定元素,則添加指定元素。
void clear()
從此 set 中移除所有元素。
** Object clone() **
返回此 HashSet 實例的淺表副本:並沒有復制這些元素本身。
** boolean contains(Object o) **
如果此 set 包含指定元素,則返回 true。
** boolean isEmpty()
如果此 set 不包含任何元素,則返回 true。
** Iterator
返回對此 set 中元素進行迭代的迭代器。
** boolean remove(Object o) **
如果指定元素存在於此 set 中,則將其移除。
** int size()**
返回此 set 中的元素的數量(set 的容量)。
TreeSet
基於 TreeMap 的 NavigableSet 實現。使用元素的自然順序對元素進行排序,或者根據創建 set 時提供的 Comparator進行排序,具體取決於使用的構造方法。
構造方法和方法比較類似就不說了
遍歷(和list相似)
對 set 的遍歷
1.迭代遍歷:
Set<String> set = new HashSet<String>();
Iterator<String> it = set.iterator();
while (it.hasNext()) {
String str = it.next();
System.out.println(str);
}
2.for(foreach)循環遍歷:
for (String str : set) {
System.out.println(str);
}
Map(鍵值對、鍵唯一、值不唯一)
Map集合中存儲的是鍵值對,鍵不能重復,值可以重復。根據鍵得到值,對map集合遍歷時先得到鍵的set集合,對set集合進行遍歷,得到相應的值。
HashMap
數組方式存儲key/value,線程非安全,允許null作為key和value,key不可以重復,value允許重復,不保證元素迭代順序是按照插入時的順序,key的hash值是先計算key的hashcode值,然后再進行計算,每次容量擴容會重新計算所以key的hash值,會消耗資源,要求key必須重寫equals和hashcode方法
默認初始容量16,加載因子0.75,擴容為舊容量乘2,查找元素快,如果key一樣則比較value,如果value不一樣,則按照鏈表結構存儲value,就是一個key后面有多個value;
方法
1、添加:
V put(K key, V value) (可以相同的key值,但是添加的value值會覆蓋前面的,返回值是前一個,如果沒有就返回null)
putAll(Map<? extends K,? extends V> m) 從指定映射中將所有映射關系復制到此映射中(可選操作)。
2、刪除
remove() 刪除關聯對象,指定key對象
clear() 清空集合對象
3、獲取
value get(key) 可以用於判斷鍵是否存在的情況。當指定的鍵不存在的時候,返回的是null。
4、判斷:
boolean isEmpty() 長度為0返回true否則false
boolean containsKey(Object key) 判斷集合中是否包含指定的key
boolean containsValue(Object value) 判斷集合中是否包含指定的value
4、長度:
Int size()
map的主要的方法就這幾個
Hashtable
Hashtable與HashMap類似,是HashMap的線程安全版,它支持線程的同步,即任一時刻只有一個線程能寫Hashtable,因此也導致了Hashtale在寫入時會比較慢,它繼承自Dictionary類,不同的是它不允許記錄的鍵或者值為null,同時效率較低。
LinkedHashMap
LinkedHashMap保存了記錄的插入順序,在用Iteraor遍歷LinkedHashMap時,先得到的記錄肯定是先插入的,在遍歷的時候會比HashMap慢,有HashMap的全部特性。
TreeMap
基於紅黑二叉樹的NavigableMap的實現,線程非安全,不允許null,key不可以重復,value允許重復,存入TreeMap的元素應當實現Comparable接口或者實現Comparator接口,會按照排序后的順序迭代元素,兩個相比較的key不得拋出classCastException。主要用於存入元素的時候對元素進行自動排序,迭代輸出的時候就按排序順序輸出
遍歷
第一種:KeySet()
將Map中所有的鍵存入到set集合中。因為set具備迭代器。所有可以迭代方式取出所有的鍵,再根據get方法。獲取每一個鍵對應的值。 keySet():迭代后只能通過get()取key 。
取到的結果會亂序,是因為取得數據行主鍵的時候,使用了HashMap.keySet()方法,而這個方法返回的Set結果,里面的數據是亂序排放的。
Map map = new HashMap();
map.put("key1","lisi1");
map.put("key2","lisi2");
map.put("key3","lisi3");
map.put("key4","lisi4");
//先獲取map集合的所有鍵的set集合,keyset()
Iterator it = map.keySet().iterator();
//獲取迭代器
while(it.hasNext()){
Object key = it.next();
System.out.println(map.get(key));
}
第二種: values() 獲取所有的值.
Collection
Collection<String> vs = map.values();
Iterator<String> it = vs.iterator();
while (it.hasNext()) {
String value = it.next();
System.out.println(" value=" + value);
}
第三種:entrySet()
Set<Map.Entry<K,V>> entrySet() //返回此映射中包含的映射關系的 Set 視圖。(一個關系就是一個鍵-值對),就是把(key-value)作為一個整體一對一對地存放到Set集合當中的。Map.Entry表示映射關系。entrySet():迭代后可以e.getKey(),e.getValue()兩種方法來取key和value。返回的是Entry接口。
典型用法如下:
// 返回的Map.Entry對象的Set集合 Map.Entry包含了key和value對象
Set<Map.Entry<Integer, String>> es = map.entrySet();
Iterator<Map.Entry<Integer, String>> it = es.iterator();
while (it.hasNext()) {
// 返回的是封裝了key和value對象的Map.Entry對象
Map.Entry<Integer, String> en = it.next();
// 獲取Map.Entry對象中封裝的key和value對象
Integer key = en.getKey();
String value = en.getValue();
System.out.println("key=" + key + " value=" + value);
}
推薦使用第三種方式,即entrySet()方法,效率較高。
對於keySet其實是遍歷了2次,一次是轉為iterator,一次就是從HashMap中取出key所對於的value。而entryset只是遍歷了第一次,它把key和value都放到了entry中,所以快了。兩種遍歷的遍歷時間相差還是很明顯的。
總結:
Vector和ArrayList
1,vector是線程同步的,所以它也是線程安全的,而arraylist是線程異步的,是不安全的。如果不考慮到線程的安全因素,一般用arraylist效率比較高。
2,如果集合中的元素的數目大於目前集合數組的長度時,vector增長率為目前數組長度的100%,而arraylist增長率為目前數組長度的50%。如果在集合中使用數據量比較大的數據,用vector有一定的優勢。
3,如果查找一個指定位置的數據,vector和arraylist使用的時間是相同的,如果頻繁的訪問數據,這個時候使用vector和arraylist都可以。而如果移動一個指定位置會導致后面的元素都發生移動,這個時候就應該考慮到使用linklist,因為它移動一個指定位置的數據時其它元素不移動。
ArrayList 和Vector是采用數組方式存儲數據,此數組元素數大於實際存儲的數據以便增加和插入元素,都允許直接序號索引元素,但是插入數據要涉及到數組元素移動等內存操作,所以索引數據快,插入數據慢,Vector由於使用了synchronized方法(線程安全)所以性能上比ArrayList要差,LinkedList使用雙向鏈表實現存儲,按序號索引數據需要進行向前或向后遍歷,但是插入數據時只需要記錄本項的前后項即可,所以插入數度較快。
arraylist和linkedlist
1.ArrayList是實現了基於動態數組的數據結構,LinkedList基於鏈表的數據結構。
2.對於隨機訪問get和set,ArrayList覺得優於LinkedList,因為LinkedList要移動指針。
3.對於新增和刪除操作add和remove,LinedList比較占優勢,因為ArrayList要移動數據。 這一點要看實際情況的。若只對單條數據插入或刪除,ArrayList的速度反而優於LinkedList。但若是批量隨機的插入刪除數據,LinkedList的速度大大優於ArrayList. 因為ArrayList每插入一條數據,要移動插入點及之后的所有數據。
HashMap與TreeMap
1、 HashMap通過hashcode對其內容進行快速查找,而TreeMap中所有的元素都保持着某種固定的順序,如果你需要得到一個有序的結果你就應該使用TreeMap(HashMap中元素的排列順序是不固定的)。
2、在Map 中插入、刪除和定位元素,HashMap是最好的選擇。但如果您要按自然順序或自定義順序遍歷鍵,那么TreeMap會更好。使用HashMap要求添加的鍵類明確定義了hashCode()和 equals()的實現。
兩個map中的元素一樣,但順序不一樣,導致hashCode()不一樣。
同樣做測試:
在HashMap中,同樣的值的map,順序不同,equals時,false;
而在treeMap中,同樣的值的map,順序不同,equals時,true,說明,treeMap在equals()時是整理了順序了的。
HashTable與HashMap
1、同步性:Hashtable是線程安全的,也就是說是同步的,而HashMap是線程序不安全的,不是同步的。
2、HashMap允許存在一個為null的key,多個為null的value 。
3、hashtable的key和value都不允許為null。