轉載請注明出處:http://www.cnblogs.com/wangyingli/p/5919297.html
數據結構學了有一年的時間了,但是一直沒有好好的總結一下,現在回想起來,感覺好像都不怎么記得了。所以接下來一段時間我將重新學習一下,算是溫故而知新了。本着「分享是一種美德」的精神,我將把我的學習總結記錄下來,並與大家分享。
本節的主要內容有:
- 一、數據結構
- 1、定義
- 2、關於數據結構的幾個術語
- 3、邏輯結構與物理結構
- 二、抽象數據類型
- 三、算法
- 四、算法的復雜度
- 1、時間復雜度
- 2、空間復雜度
一、數據結構
1、定義
數據結構是計算機存儲、組織數據的方式。在現實世界中,不同數據元素之間不是獨立的,而是存在特定關系的,我們將這些關系稱為結構。同樣在計算機中,數據元素也不是孤立、雜亂無序的,而是具有內在聯系的數據集合。
數據元素之間存在的一種或多種特定關系,也就是數據的組織形式,叫數據結構。也可以說,數據結構是指相互之間存在一種或多種特定關系的數據元素的集合。
通常情況下,精心選擇的數據結構可以帶來更高的運行或者存儲效率。程序設計的實質就是數據結構和算法是設計,因此我們說程序設計 = 數據結構 + 算法。
2、關於數據結構的幾個術語
-
數據:是描述客觀事物的符號,是計算機中可以操作的對象,是能被計算機識別,並輸入給計算機處理的符號集合。它不僅包括整型等數值類型,還包括字符、聲音、圖像等非數值類型。這些類型都具備兩個特征:
- 可以輸入計算機
- 能被計算機程序處理
-
數據元素:是組成數據的、有一定意義的基本單位,在計算機中通常作為整體處理。也被稱為記錄。
-
數據項:一個數據元素可以由若干個數據項組成。數據項是A數據的不可分割的最小單位。。
-
數據對象:是性質相同的數據元素的集合,是數據的子集。
例如:一本書的書目信息為一個數據元素,而書目信息的每一項(如書名、作者名等)為一個數據項。
3、邏輯結構與物理結構
按照不同的角度,數據結構可分為邏輯結構和物理結構。其中邏輯結構是面向問題的,而物理結構是面向計算機的,它們的基本目標都是將數據及其邏輯關系存儲到計算機內存中。
- 邏輯結構:是指數據對象中數據元素之間的相互關系。分為四種:集合結構、線性結構、樹形結構和圖形結構。
- 物理(存儲)結構:是指數據的邏輯結構在計算機中的存儲形式。數據的存儲結構應正確反映數據元素之間的邏輯關系,這是關鍵。數據元素的存儲結構可分為兩種:順序存儲結構和鏈式存儲結構。
- 順序存儲結構:把數據元素放在地址連續的存儲單元中,數據間的邏輯關系和物理關系一致。如,數組。
- 鏈式存儲結構:把數據元素放在任意的存儲單元中,數據間使用指針關聯。數據元素的存儲關系不能反映其邏輯關系。如,鏈表。
二、抽象數據類型
數據類型是指一組性質相同的值的集合及定義在該集合上的一些操作的總稱。而抽象是指抽象出事物具有的普遍性的本質,它是抽出問題的特征而忽略非本質的細節,是對具體事物的一個概括。抽象隱藏了繁雜的細節,只保留實現目標所必須的信息。因此抽象數據類型可以定義為:
抽象數據類型(Abstract Data Type,ADT)是指一個數學模型及定義在該模型上的一組操作,它是一種向用例隱藏內部表示的數據類型。
面向對象編程的特征之一就是使用數據類型的實現封裝數據,以簡化實現、隔離用例開發、實現模塊化編程。抽象數據類型體現了程序設計中問題分解、抽象和信息隱藏的特性。它將實際生活中的問題分解為多個規模小、能夠獨立開發和調試的小型模塊,然后進行獨立編程。這種方式將代碼的影響限制在局部區域,改進了我們的軟件質量,促進了代碼復用。抽象數據類型抽象的層次越高,那么可復用性也越強。比如:java中的Object是對所有對象的抽象。
java中數據類型可以分為兩類:
- 基本(原子)類型:不可以再分解的基本類型,包括int、short、long等
- 引用(結構)類型:由其他類型組合而成,可以再分解。如,String、數組等
注意:
- 對原子類型的操作不一定是原子操作,這點並發編程時應特別注意。如,在32位機上對long類型的操作就不是原子操作,因為其高32位和低32位是分別存儲的。
- Java中所有的基本數據類型都有固定的存儲范圍和大小,其不受具體機器和操作系統的影響。
三、算法
算法(Algorithm)一詞最早出現在波斯數學家al-Khwarizmi所寫的《印度數字算術》中。歐幾里得算法(求兩個整數的最大公約數)被認為是史上第一個算法。
算法是解決特定問題求解步驟的描述,在計算機中表現為指令的有限序列,並且每條指令表示一個或多個操作。
算法的基本特性:
- 輸入輸出,算法具有零個或多個輸入,至少有一個或多個輸出。
- 有窮性,算法在執行有限步后能夠自動結束,不會出現無限循環。
- 確定性,算法的每一步都具有確定的含義,不會出現二義性。
- 可行性,算法的每一步都能夠通過執行有限次操作完成。
程序與算法的區別:
程序(program)是軟件開發人員根據用戶需求開發的、用程序設計語言描述的適合計算機執行的指令(語句)序列。它包括「數據結構」、「算法」、「程序設計方法」和「編程語言」。程序是算法用某種程序設計語言的具體實現。程序可以不滿足算法的有窮性,比如操作系統也是一種程序,它可以一直運行。
算法的設計要求:
- 正確性,算法至少應該具有輸入、輸出和加工處理無歧義、能正確反映問題的需求、能夠得到問題的正確答案。
- 可讀性,便於閱讀、理解和交流。
- 健壯性,輸入不合法時,算法能夠給出相應的處理,而不是產生錯誤的結果。
- 高效性,算法應該盡量滿足高效率和低存儲的需求。
四、算法的復雜度
算法復雜度分為時間復雜度和空間復雜度。其作用: 時間復雜度是指執行算法所需要的計算工作量;而空間復雜度是指執行這個算法所需要的內存空間。
1、時間復雜度
算法的時間復雜度反映了算法執行的時間長短,它是度量一個算法好壞的重要指標。
一般情況下,算法中基本操作重復執行的次數是問題規模n的某個函數,用T(n)表示,若有某個輔助函數f(n),使得當n趨近於無窮大時,T(n)/f(n)的極限值為不等於零的常數,則稱f(n)是T(n)的同數量級函數。記作T(n)=O(f(n)),稱O(f(n)) 為算法的漸進時間復雜度,簡稱時間復雜度。
度量一個算法的時間復雜度通常有兩種方式:
- 事后統計法
- 事前分析法(大O表示法)
算法的時間復雜度是由最深層嵌套語句的頻度決定的。
大O表示法的推導:
- 用常數1取代運行時間中的所有加法常數
- 在修改后的運行次數函數中,只保留最高階
- 將最高階系數變為1
例1:
int i, j, temp;
for(i=0; i<n; i++) {
for(j=i, j<n; j++) {
temp++;
}
}
語句執行的總次數:
所以其時間復雜度為\(O(n^2)\)。
例2:
for(i=1;i<=n;i=i*2){
System.out.println(i);
}
執行的總次數滿足:
所以它的時間復雜度為\(O(logn)\)
例3:分析冒泡排序算法的時間復雜度
//冒泡排序算法
public static void bubbleSort(int[] data) {
if (data == null) {
return;
}
int temp = 0;
for (int i = data.length - 1; i > 0; --i){
for (int j = 0; j < i; ++j){
if (data[j + 1] < data[j]){
temp = data[j];
data[j] = data[j + 1];
data[j + 1] = temp;
}
}
}
}
算法分析:
- 最佳情況下(初始狀態是正序時),冒泡排序算法只需要一次掃描即可完成排序,此時比較次數 \(C_{min} = n - 1\),移動次數 \(M_{min} = 0\),所以時間復雜度為 \(O(n)\)
- 最差情況下(初始狀態為逆序時),需要進行 \(n-1\) 次排序,每次排序進行 \(n-1\) 比較,此時比較次數 \(C_{max} = \frac{n(n+1)}{2}\),移動次數 \(M_{max} = \frac{3n(n+1)}{2}\),所以時間復雜度為\(O(n^2)\)
常見時間復雜度大小關系:
算法的時間復雜度和兩個因素有關:算法中的最大嵌套循環層數;最大嵌套循環結構中每次循環的次數。一般來說,具有多項式時間復雜度的算法是可以接受的;具有指數時間復雜度的算法,只有當n足夠小時才可以使用。一般效率較好的算法要控制在O(N)或者O(log2 N)
2、空間復雜度
空間復雜度(Space Complexity)是對一個算法在運行過程中臨時占用存儲空間大小的量度,記做S(n)=O(f(n))。其中,n為問題規模,f(n)為語句關於n所占存儲空間的函數。
算法的空間復雜度分析方法和算法的時間復雜度分析方法基本相同。
例如:
int i, j, temp;
for(i=0; i<n; i++) {
for(j=i, j<n; j++) {
temp++;
}
}
上方代碼中,僅需為變量 i、j、temp分配空間即可,所以空間復雜度 \(S(n) = O(1)\)。
參考
- 《大話數據結構》
- 《算法》第四版
- 數據結構Java實現01----算法概述