Java 數據結構
Java工具包提供了強大的數據結構。在Java中的數據結構主要包括以下幾種接口和類:
- 枚舉(Enumeration)
- 位集合(BitSet)
- 向量(Vector)
- 棧(Stack)
- 字典(Dictionary)
- 哈希表(Hashtable)
- 屬性(Properties)
以上這些類是傳統遺留的,在Java2中引入了一種新的框架-集合框架(Collection),我們后面再討論。
枚舉(Enumeration)
枚舉(Enumeration)接口雖然它本身不屬於數據結構,但它在其他數據結構的范疇里應用很廣。 枚舉(The Enumeration)接口定義了一種從數據結構中取回連續元素的方式。
例如,枚舉定義了一個叫nextElement 的方法,該方法用來得到一個包含多元素的數據結構的下一個元素。
位集合(BitSet)
位集合類實現了一組可以單獨設置和清除的位或標志。
該類在處理一組布爾值的時候非常有用,你只需要給每個值賦值一"位",然后對位進行適當的設置或清除,就可以對布爾值進行操作了。
向量(Vector)
向量(Vector)類和傳統數組非常相似,但是Vector的大小能根據需要動態的變化。
和數組一樣,Vector對象的元素也能通過索引訪問。
使用Vector類最主要的好處就是在創建對象的時候不必給對象指定大小,它的大小會根據需要動態的變化。
棧(Stack)
棧(Stack)實現了一個后進先出(LIFO)的數據結構。
你可以把棧理解為對象的垂直分布的棧,當你添加一個新元素時,就將新元素放在其他元素的頂部。
當你從棧中取元素的時候,就從棧頂取一個元素。換句話說,最后進棧的元素最先被取出。
字典(Dictionary)
字典(Dictionary) 類是一個抽象類,它定義了鍵映射到值的數據結構。
當你想要通過特定的鍵而不是整數索引來訪問數據的時候,這時候應該使用Dictionary。
由於Dictionary類是抽象類,所以它只提供了鍵映射到值的數據結構,而沒有提供特定的實現。
哈希表(Hashtable)
Hashtable類提供了一種在用戶定義鍵結構的基礎上來組織數據的手段。
例如,在地址列表的哈希表中,你可以根據郵政編碼作為鍵來存儲和排序數據,而不是通過人名。
哈希表鍵的具體含義完全取決於哈希表的使用情景和它包含的數據。
屬性(Properties)
Properties 繼承於 Hashtable.Properties 類表示了一個持久的屬性集.屬性列表中每個鍵及其對應值都是一個字符串。
Properties 類被許多Java類使用。例如,在獲取環境變量時它就作為System.getProperties()方法的返回值。
Java 集合框架
早在 Java 2 中之前,Java 就提供了特設類。比如:Dictionary, Vector, Stack, 和 Properties 這些類用來存儲和操作對象組。
雖然這些類都非常有用,但是它們缺少一個核心的,統一的主題。由於這個原因,使用 Vector 類的方式和使用 Properties 類的方式有着很大不同。
集合框架被設計成要滿足以下幾個目標。
-
該框架必須是高性能的。基本集合(動態數組,鏈表,樹,哈希表)的實現也必須是高效的。
-
該框架允許不同類型的集合,以類似的方式工作,具有高度的互操作性。
-
對一個集合的擴展和適應必須是簡單的。
為此,整個集合框架就圍繞一組標准接口而設計。你可以直接使用這些接口的標准實現,諸如: LinkedList, HashSet, 和 TreeSet 等,除此之外你也可以通過這些接口實現自己的集合。
從上面的集合框架圖可以看到,Java 集合框架主要包括兩種類型的容器,一種是集合(Collection),存儲一個元素集合,另一種是圖(Map),存儲鍵/值對映射。Collection 接口又有 3 種子類型,List、Set 和 Queue,再下面是一些抽象類,最后是具體實現類,常用的有 ArrayList、LinkedList、HashSet、LinkedHashSet、HashMap、LinkedHashMap 等等。
集合框架是一個用來代表和操縱集合的統一架構。所有的集合框架都包含如下內容:
-
接口:是代表集合的抽象數據類型。例如 Collection、List、Set、Map 等。之所以定義多個接口,是為了以不同的方式操作集合對象
-
實現(類):是集合接口的具體實現。從本質上講,它們是可重復使用的數據結構,例如:ArrayList、LinkedList、HashSet、HashMap。
-
算法:是實現集合接口的對象里的方法執行的一些有用的計算,例如:搜索和排序。這些算法被稱為多態,那是因為相同的方法可以在相似的接口上有着不同的實現。
除了集合,該框架也定義了幾個 Map 接口和類。Map 里存儲的是鍵/值對。盡管 Map 不是集合,但是它們完全整合在集合中。
集合框架體系如圖所示
Java 集合框架提供了一套性能優良,使用方便的接口和類,java集合框架位於java.util包中, 所以當使用集合框架的時候需要進行導包。
集合接口
集合框架定義了一些接口。本節提供了每個接口的概述:
序號 | 接口描述 |
---|---|
1 | Collection 接口 Collection 是最基本的集合接口,一個 Collection 代表一組 Object,即 Collection 的元素, Java不提供直接繼承自Collection的類,只提供繼承於的子接口(如List和set)。 Collection 接口存儲一組不唯一,無序的對象。 |
2 | List 接口 List接口是一個有序的 Collection,使用此接口能夠精確的控制每個元素插入的位置,能夠通過索引(元素在List中位置,類似於數組的下標)來訪問List中的元素,第一個元素的索引為 0,而且允許有相同的元素。 List 接口存儲一組不唯一,有序(插入順序)的對象。 |
3 | Set Set 具有與 Collection 完全一樣的接口,只是行為上不同,Set 不保存重復的元素。 Set 接口存儲一組唯一,無序的對象。 |
4 | SortedSet 繼承於Set保存有序的集合。 |
5 | Map Map 接口存儲一組鍵值對象,提供key(鍵)到value(值)的映射。 |
6 | Map.Entry 描述在一個Map中的一個元素(鍵/值對)。是一個Map的內部類。 |
7 | SortedMap 繼承於 Map,使 Key 保持在升序排列。 |
8 | Enumeration 這是一個傳統的接口和定義的方法,通過它可以枚舉(一次獲得一個)對象集合中的元素。這個傳統接口已被迭代器取代。 |
Set和List的區別
-
1. Set 接口實例存儲的是無序的,不重復的數據。List 接口實例存儲的是有序的,可以重復的元素。
-
2. Set檢索效率低下,刪除和插入效率高,插入和刪除不會引起元素位置改變 <實現類有HashSet,TreeSet>。
-
3. List和數組類似,可以動態增長,根據實際存儲的數據的長度自動增長List的長度。查找元素效率高,插入刪除效率低,因為會引起其他元素位置改變 <實現類有ArrayList,LinkedList,Vector> 。
集合實現類(集合類)
Java提供了一套實現了Collection接口的標准集合類。其中一些是具體類,這些類可以直接拿來使用,而另外一些是抽象類,提供了接口的部分實現。
標准集合類匯總於下表:
序號 | 類描述 |
---|---|
1 | AbstractCollection 實現了大部分的集合接口。 |
2 | AbstractList 繼承於AbstractCollection 並且實現了大部分List接口。 |
3 | AbstractSequentialList 繼承於 AbstractList ,提供了對數據元素的鏈式訪問而不是隨機訪問。 |
4 | LinkedList 該類實現了List接口,允許有null(空)元素。主要用於創建鏈表數據結構,該類沒有同步方法,如果多個線程同時訪問一個List,則必須自己實現訪問同步,解決方法就是在創建List時候構造一個同步的List。例如: Listlist=Collections.synchronizedList(newLinkedList(...)); LinkedList 查找效率低。 |
5 | ArrayList 該類也是實現了List的接口,實現了可變大小的數組,隨機訪問和遍歷元素時,提供更好的性能。該類也是非同步的,在多線程的情況下不要使用。ArrayList 增長當前長度的50%,插入刪除效率低。 |
6 | AbstractSet 繼承於AbstractCollection 並且實現了大部分Set接口。 |
7 | HashSet 該類實現了Set接口,不允許出現重復元素,不保證集合中元素的順序,允許包含值為null的元素,但最多只能一個。 |
8 | LinkedHashSet 具有可預知迭代順序的 Set 接口的哈希表和鏈接列表實現。 |
9 | TreeSet 該類實現了Set接口,可以實現排序等功能。 |
10 | AbstractMap 實現了大部分的Map接口。 |
11 | HashMap HashMap 是一個散列表,它存儲的內容是鍵值對(key-value)映射。 該類實現了Map接口,根據鍵的HashCode值存儲數據,具有很快的訪問速度,最多允許一條記錄的鍵為null,不支持線程同步。 |
12 | TreeMap 繼承了AbstractMap,並且使用一顆樹。 |
13 | WeakHashMap 繼承AbstractMap類,使用弱密鑰的哈希表。 |
14 | LinkedHashMap 繼承於HashMap,使用元素的自然順序對元素進行排序. |
15 | IdentityHashMap 繼承AbstractMap類,比較文檔時使用引用相等。 |
在前面的教程中已經討論通過java.util包中定義的類,如下所示:
序號 | 類描述 |
---|---|
1 | Vector 該類和ArrayList非常相似,但是該類是同步的,可以用在多線程的情況,該類允許設置默認的增長長度,默認擴容方式為原來的2倍。 |
2 | Stack 棧是Vector的一個子類,它實現了一個標准的后進先出的棧。 |
3 | Dictionary Dictionary 類是一個抽象類,用來存儲鍵/值對,作用和Map類相似。 |
4 | Hashtable Hashtable 是 Dictionary(字典) 類的子類,位於 java.util 包中。 |
5 | Properties Properties 繼承於 Hashtable,表示一個持久的屬性集,屬性列表中每個鍵及其對應值都是一個字符串。 |
6 | BitSet 一個Bitset類創建一種特殊類型的數組來保存位值。BitSet中數組大小會隨需要增加。 |
集合算法
集合框架定義了幾種算法,可用於集合和映射。這些算法被定義為集合類的靜態方法。
在嘗試比較不兼容的類型時,一些方法能夠拋出 ClassCastException異常。當試圖修改一個不可修改的集合時,拋出UnsupportedOperationException異常。
集合定義三個靜態的變量:EMPTY_SET,EMPTY_LIST,EMPTY_MAP的。這些變量都不可改變。
序號 | 算法描述 |
---|---|
1 | Collection Algorithms 這里是一個列表中的所有算法實現。 |
如何使用迭代器
通常情況下,你會希望遍歷一個集合中的元素。例如,顯示集合中的每個元素。
一般遍歷數組都是采用for循環或者增強for,這兩個方法也可以用在集合框架,但是還有一種方法是采用迭代器遍歷集合框架,它是一個對象,實現了Iterator 接口或ListIterator接口。
迭代器,使你能夠通過循環來得到或刪除集合的元素。ListIterator 繼承了Iterator,以允許雙向遍歷列表和修改元素。
序號 | 迭代器方法描述 |
---|---|
1 | 使用 Java Iterator 這里通過實例列出Iterator和listIterator接口提供的所有方法。 |
如何使用比較器
TreeSet和TreeMap的按照排序順序來存儲元素. 然而,這是通過比較器來精確定義按照什么樣的排序順序。
這個接口可以讓我們以不同的方式來排序一個集合。
序號 | 比較器方法描述 |
---|---|
1 | 使用 Java Comparator 這里通過實例列出Comparator接口提供的所有方法 |
Java 泛型
Java 泛型(generics)是 JDK 5 中引入的一個新特性, 泛型提供了編譯時類型安全檢測機制,該機制允許程序員在編譯時檢測到非法的類型。
泛型的本質是參數化類型,也就是說所操作的數據類型被指定為一個參數。
假定我們有這樣一個需求:寫一個排序方法,能夠對整型數組、字符串數組甚至其他任何類型的數組進行排序,該如何實現?
答案是可以使用 Java 泛型。
使用 Java 泛型的概念,我們可以寫一個泛型方法來對一個對象數組排序。然后,調用該泛型方法來對整型數組、浮點數數組、字符串數組等進行排序。
泛型方法
你可以寫一個泛型方法,該方法在調用時可以接收不同類型的參數。根據傳遞給泛型方法的參數類型,編譯器適當地處理每一個方法調用。
下面是定義泛型方法的規則:
- 所有泛型方法聲明都有一個類型參數聲明部分(由尖括號分隔),該類型參數聲明部分在方法返回類型之前(在下面例子中的<E>)。
- 每一個類型參數聲明部分包含一個或多個類型參數,參數間用逗號隔開。一個泛型參數,也被稱為一個類型變量,是用於指定一個泛型類型名稱的標識符。
- 類型參數能被用來聲明返回值類型,並且能作為泛型方法得到的實際參數類型的占位符。
- 泛型方法體的聲明和其他方法一樣。注意類型參數只能代表引用型類型,不能是原始類型(像int,double,char的等)。
泛型類
泛型類的聲明和非泛型類的聲明類似,除了在類名后面添加了類型參數聲明部分。
和泛型方法一樣,泛型類的類型參數聲明部分也包含一個或多個類型參數,參數間用逗號隔開。一個泛型參數,也被稱為一個類型變量,是用於指定一個泛型類型名稱的標識符。因為他們接受一個或多個參數,這些類被稱為參數化的類或參數化的類型。
類型通配符
1、類型通配符一般是使用?代替具體的類型參數。例如 List<?> 在邏輯上是List<String>,List<Integer> 等所有List<具體類型實參>的父類。
Java 序列化
Java 提供了一種對象序列化的機制,該機制中,一個對象可以被表示為一個字節序列,該字節序列包括該對象的數據、有關對象的類型的信息和存儲在對象中數據的類型。
將序列化對象寫入文件之后,可以從文件中讀取出來,並且對它進行反序列化,也就是說,對象的類型信息、對象的數據,還有對象中的數據類型可以用來在內存中新建對象。
整個過程都是 Java 虛擬機(JVM)獨立的,也就是說,在一個平台上序列化的對象可以在另一個完全不同的平台上反序列化該對象。
類 ObjectInputStream 和 ObjectOutputStream 是高層次的數據流,它們包含反序列化和序列化對象的方法。
序列化對象
ObjectOutputStream 類用來序列化一個對象,如下的 SerializeDemo 例子實例化了一個 Employee 對象,並將該對象序列化到一個文件中。
該程序執行后,就創建了一個名為 employee.ser 文件。該程序沒有任何輸出,但是你可以通過代碼研讀來理解程序的作用。
Java 網絡編程
網絡編程是指編寫運行在多個設備(計算機)的程序,這些設備都通過網絡連接起來。
java.net 包中 J2SE 的 API 包含有類和接口,它們提供低層次的通信細節。你可以直接使用這些類和接口,來專注於解決問題,而不用關注通信細節。
java.net 包中提供了兩種常見的網絡協議的支持:
-
TCP:TCP 是傳輸控制協議的縮寫,它保障了兩個應用程序之間的可靠通信。通常用於互聯網協議,被稱 TCP / IP。
-
UDP:UDP 是用戶數據報協議的縮寫,一個無連接的協議。提供了應用程序之間要發送的數據的數據包。
本教程主要講解以下兩個主題。
-
Socket 編程:這是使用最廣泛的網絡概念,它已被解釋地非常詳細。
-
URL 處理:這部分會在另外的篇幅里講,點擊這里更詳細地了解在 Java 語言中的 URL 處理。
Socket 編程
套接字使用TCP提供了兩台計算機之間的通信機制。 客戶端程序創建一個套接字,並嘗試連接服務器的套接字。
當連接建立時,服務器會創建一個 Socket 對象。客戶端和服務器現在可以通過對 Socket 對象的寫入和讀取來進行通信。
java.net.Socket 類代表一個套接字,並且 java.net.ServerSocket 類為服務器程序提供了一種來監聽客戶端,並與他們建立連接的機制。
以下步驟在兩台計算機之間使用套接字建立TCP連接時會出現:
-
服務器實例化一個 ServerSocket 對象,表示通過服務器上的端口通信。
-
服務器調用 ServerSocket 類的 accept() 方法,該方法將一直等待,直到客戶端連接到服務器上給定的端口。
-
服務器正在等待時,一個客戶端實例化一個 Socket 對象,指定服務器名稱和端口號來請求連接。
-
Socket 類的構造函數試圖將客戶端連接到指定的服務器和端口號。如果通信被建立,則在客戶端創建一個 Socket 對象能夠與服務器進行通信。
-
在服務器端,accept() 方法返回服務器上一個新的 socket 引用,該 socket 連接到客戶端的 socket。
連接建立后,通過使用 I/O 流在進行通信,每一個socket都有一個輸出流和一個輸入流,客戶端的輸出流連接到服務器端的輸入流,而客戶端的輸入流連接到服務器端的輸出流。
TCP 是一個雙向的通信協議,因此數據可以通過兩個數據流在同一時間發送.以下是一些類提供的一套完整的有用的方法來實現 socket。
ServerSocket 類的方法
服務器應用程序通過使用 java.net.ServerSocket 類以獲取一個端口,並且偵聽客戶端請求。
ServerSocket 類有四個構造方法:
序號 | 方法描述 |
1 | public ServerSocket(int port) throws IOException 創建綁定到特定端口的服務器套接字。 |
2 | public ServerSocket(int port, int backlog) throws IOException 利用指定的 backlog 創建服務器套接字並將其綁定到指定的本地端口號。 |
3 | public ServerSocket(int port, int backlog, InetAddress address) throws IOException 使用指定的端口、偵聽 backlog 和要綁定到的本地 IP 地址創建服務器。 |
4 | public ServerSocket() throws IOException 創建非綁定服務器套接字。 |
創建非綁定服務器套接字。 如果 ServerSocket 構造方法沒有拋出異常,就意味着你的應用程序已經成功綁定到指定的端口,並且偵聽客戶端請求。
這里有一些 ServerSocket 類的常用方法:
序號 | 方法描述 |
1 | public int getLocalPort() 返回此套接字在其上偵聽的端口。 |
2 | public Socket accept() throws IOException 偵聽並接受到此套接字的連接。 |
3 | public void setSoTimeout(int timeout) 通過指定超時值啟用/禁用 SO_TIMEOUT,以毫秒為單位。 |
4 | public void bind(SocketAddress host, int backlog) 將 ServerSocket 綁定到特定地址(IP 地址和端口號)。 |
Socket 類的方法
java.net.Socket 類代表客戶端和服務器都用來互相溝通的套接字。客戶端要獲取一個 Socket 對象通過實例化 ,而 服務器獲得一個 Socket 對象則通過 accept() 方法的返回值。
Socket 類有五個構造方法.
序號 | 方法描述 |
1 | public Socket(String host, int port) throws UnknownHostException, IOException. 創建一個流套接字並將其連接到指定主機上的指定端口號。 |
2 | public Socket(InetAddress host, int port) throws IOException 創建一個流套接字並將其連接到指定 IP 地址的指定端口號。 |
3 | public Socket(String host, int port, InetAddress localAddress, int localPort) throws IOException. 創建一個套接字並將其連接到指定遠程主機上的指定遠程端口。 |
4 | public Socket(InetAddress host, int port, InetAddress localAddress, int localPort) throws IOException. 創建一個套接字並將其連接到指定遠程地址上的指定遠程端口。 |
5 | public Socket() 通過系統默認類型的 SocketImpl 創建未連接套接字 |
當 Socket 構造方法返回,並沒有簡單的實例化了一個 Socket 對象,它實際上會嘗試連接到指定的服務器和端口。
下面列出了一些感興趣的方法,注意客戶端和服務器端都有一個 Socket 對象,所以無論客戶端還是服務端都能夠調用這些方法。
序號 | 方法描述 |
1 | public void connect(SocketAddress host, int timeout) throws IOException 將此套接字連接到服務器,並指定一個超時值。 |
2 | public InetAddress getInetAddress() 返回套接字連接的地址。 |
3 | public int getPort() 返回此套接字連接到的遠程端口。 |
4 | public int getLocalPort() 返回此套接字綁定到的本地端口。 |
5 | public SocketAddress getRemoteSocketAddress() 返回此套接字連接的端點的地址,如果未連接則返回 null。 |
6 | public InputStream getInputStream() throws IOException 返回此套接字的輸入流。 |
7 | public OutputStream getOutputStream() throws IOException 返回此套接字的輸出流。 |
8 | public void close() throws IOException 關閉此套接字。 |
InetAddress 類的方法
這個類表示互聯網協議(IP)地址。下面列出了 Socket 編程時比較有用的方法:
序號 | 方法描述 |
1 | static InetAddress getByAddress(byte[] addr) 在給定原始 IP 地址的情況下,返回 InetAddress 對象。 |
2 | static InetAddress getByAddress(String host, byte[] addr) 根據提供的主機名和 IP 地址創建 InetAddress。 |
3 | static InetAddress getByName(String host) 在給定主機名的情況下確定主機的 IP 地址。 |
4 | String getHostAddress() 返回 IP 地址字符串(以文本表現形式)。 |
5 | String getHostName() 獲取此 IP 地址的主機名。 |
6 | static InetAddress getLocalHost() 返回本地主機。 |
7 | String toString() 將此 IP 地址轉換為 String。 |
Socket 客戶端實例
如下的 GreetingClient 是一個客戶端程序,該程序通過 socket 連接到服務器並發送一個請求,然后等待一個響應。
GreetingClient.java 文件代碼:
Socket 服務端實例
如下的GreetingServer 程序是一個服務器端應用程序,使用 Socket 來監聽一個指定的端口。