地統計分析是空間統計學的一個重要分支,被廣泛應用於許多領域。ArcGIS地統計分析功能是借助於ArcGIS地統計分析模塊(ArcGIS Geostatistical Analyst)來實現的。
一、ArcGIS地統計分析概述
1.ArcGIS地統計分析模塊介紹
ArcGIS地統計分析模塊(ArcGIS Geostatistical Analyst)是一個完整的工具包,它帶有為默認模型設計的穩定性參數。
2.地統計分析基礎簡介
地統計(Geostatistics)又稱地質統計,也可以稱為空間統計分析。是統計學的一個分支。
地統計學是以區域化變量理論(theory of regionalized variable)為基礎,以變異函數(variogram)為基本工具來研究分布於空間,並呈現出一定的隨機性和結構性的自然現象的科學。
二、探索性數據空間分析
探索性分析可以讓用戶更清楚的了解所用的探索性分析,包括數據的屬性、分布以及空間數據的變異性和相關性,並以此來分析數據的變化趨勢,從而利用已知的數據推測擬合未知的數據。探索性分析也可以讓用戶更深入的認識研究對象,從而對與其數據相關的問題做出更好地分析和決策。
1.添加探索性數據分析工具
通常,ArcGIS的探索性數據分析模塊並沒有打開,需要手動添加。
①工具-擴展-選中Geostatistical Analyst
②添加Geostatistical Analyst工具條,選擇視圖-工具條,確保Geostatistical Analyst工具條被選中。
2.Histogram(直方圖)
Histogram(直方圖)指對采樣數據按一定的分級方案進行分級,統計采樣點落入各個級別中的個數或占總采樣數的百分比,並通過條帶圖或柱狀圖表現出來。直方圖可以直觀的反映采樣數據特征與規律。
3.正態QQPlot分布圖和普通QQPlot分布圖
QQPlot分布圖是可以將現有的數據的分布與標准正態分布對比,從而來分析和評價現有數據。其是利用分布的分位數而做出的圖形,如果數據圖形越接近一條直線,則它越接近於服從正態分布。
①Normal QQPlot分布圖(正態QQPlot分布圖)
②General QQPlot分布圖(普通QQPlot分布圖)
4.Trend Analysis(趨勢分析)
趨勢分析可以利用樣點數據生成以數據某一屬性值為高度的三維透視圖,從而幫助用戶從不同視角分析采樣數據集的全局趨勢。
樣點的位置由X、Y和Z3個值來決定。X、Y確定樣點平面坐標,Z值則是樣點數據的某一屬性值。三維透視圖中的每個黑線就代表了樣點的位置和高度,位置就是樣點X、Y平面坐標,高度即樣點數據的某一屬性值的大小。
5.Voronoi Map(Voronoi地圖)
Voronoi地圖是由樣點以及樣點周圍的一系列多邊形所組成。多邊形生成的要求就是,多邊形內任意位置據這一樣點的距離,都比該多邊形到其他樣點的距離要近。
Voronoi多邊形生成之后,相鄰的點就被定義為其Voronoi多邊形,與選擇樣點的Voronoi多邊形具有公共邊的其他樣點。
6.Semivariogram/Covariance Cloud(半變異、協方差函數雲)
半變異/協方差函數雲表示的是數據集中所有樣點對的理論半變異值和協方差,並把它們用兩點間距離的函數來表示,用此函數作圖來表示。
7.Crosscovariance Cloud(正交協方差函數雲)
正交協方差函數雲表示的是兩個數據集中所有樣點對的理論正交協方差,並把它們用兩個點距離的函數來表示。
三、探索性數據分析
探索性數據分析主要利用ArcGIS提供的工具和插值方法,可以確定統計數據屬性,探測數據分布、全局和局部異常值、尋求全局的變化趨勢、研究空間自相關和理解多種數據集之間的相關性。
1.檢驗數據分布
在地統計分析中,克里格方法建立在一定的假設基礎上,其在一定程度上要求所有數據值具有相同的變異性。另外,普通克里格法、簡單克里格法和泛克里格法等都假設數據服從正態分布。如果數據不服從正太分布,需要進行一定的數據變換,從而使其服從正態分布。
因此,在進行地統計分析前,檢驗數據分布特征,了解和認識數據具有非常重要的意義。數據的檢驗可以通過直方圖和正態QQPlot分布圖完成。
①通過直方圖檢驗數據分布
②通過QQPlot圖檢驗數據分布
2.尋找數據離群值
在一組平行測定數據中,有時會出現個別值與其他值相差較遠,這種值叫離群值。數據離群值分為全局離群值和局部離群值兩大類。全局離群值是指對於數據集中所有點來講,具有很搞活很低的值的觀測樣點。局部離群值對於整個數據集來講,觀測樣點的值處於正常范圍,但與其相鄰測量點比較,他又偏高或偏低。
①利用直方圖查找離群值。
②利用半變異/協方差函數雲來識別離群值
③利用Voronoi圖查找局部離群值
3.全局趨勢分析
全局趨勢分析可以通過Trend Analysis(趨勢分析)工具來實現。地物的空間趨勢分析反映了空間物體在空間區域上變化的主體特征。
趨勢面分析主要依靠空間樣點數據,通過數學的方法來擬合一個空間曲面,從而大致反映其空間分布的變化情況。要注意的是一個表面主要是由確定的全局趨勢和隨機的變異誤差來共同決定的。而趨勢面分析則會忽略這種局部的變異,只揭示其空間物體變化的總規律。
4.空間自相關及方向變異
地理空間自相關是指時間序列相鄰數值間的相關關系。大部分的地理現象都具有空間自相關性,及距離越近的兩事物越相似。地理研究對象普遍存在的變量間的關系中,確定性的是函數關系,非確定性的是相關關系。如果存在空間自相關,那么該變量本身存在某種數學模型。半變異/協方差函數雲就是這種關系的定量化表示。
5.多數據集協變分析
世界上的事物不會孤立存在,它們都處於廣泛聯系之中,並相互制約和影響。變分析主要是通過分析多因數(數據集)關聯特征,在地統計空間分析中可以有效利用這種相關特征增強建模效果,如協同克里格插值分析。
四、空間確定性插值
對采樣數據進行分析,並對采樣區地理特征認識之后,便要選擇合適的空間內插值方法來創建表面。插值方法按其實現的數學原理可以分為兩類,一類是確定性插值方法;另一類是地統計插值,也就是克里格插值。
確定性插值方法以研究區域內部的相似性(如反距離加權插值法)、或者以平滑度為基礎(如徑向基函數插值法)由已知樣點來創建表面。
確定性插值方法又可以分為兩種,即全局性插值方法和局部性插值方法。全局性插值方法以整個研究區的樣點數據集為基礎來計算預測值,局部性插值方法則使用一個大研究區域內較小的空間區域內的已知樣點來計算預測值。
1.反距離加權插值
反距離加權插值的基本原理在於,一般來講物體里的越近,它們的性質就越相近。反之,離得越遠則相似性越小。反距離加權插值法以插值點,與樣本點之間的距離為權重進行加權平均,離插值點越近的樣本點賦予的權重越大。
2.全局性多項式插值
全局性插值方法以整個研究區域的樣點數據集為基礎,用一個數學多項式來模擬計算預測值。其可以視為用一個多項式平面或曲面來全區域的擬合。此方法擬合的表面很少能與已知樣點完全重合,所以全局性插值法是非精確的插值法。
利用全局性插值法生成的表面很容易受極高和極低點值的影響,尤其在研究區邊緣地帶,因此用於模擬的有關屬性在研究區域內最好是變化平緩的。
全局多項式插值法適用的情況如下:當一個研究區域的表面變化緩慢,即這個表面上的樣點值由一個區域向另一個區域的變化平緩時,可以采用全局多項式插值法利用該研究區域內的樣點對該研究區進行表面插值。
檢驗長期變化的、全局式趨勢的影響時,一般采用全局多項式插值法,在這種情況下,應用的方法通常被稱為趨勢面分析。
3.局部多項式插值
局部多項式插值采用多個多項式,每個多項式都處在特定重疊的鄰近區域內。通過使用搜索鄰近區域對話框可以定義搜索的鄰近區域。
局部多項式插值法不是一個精確的插值方法,但它能得到一個平滑的表面。建立平滑的表面和確定變量的小范圍的變異可以使用局部多項式插值法,特別是數據集中含有短程變異時,局部多項式插值法生成的表面就能描述這種短程變異。
4.徑向基函數插值方法
徑向基函數插值法適用於大量點數據進行插值計算,同時要求獲得平滑表面的情況。將徑向基函數應用於表面變化平緩的表面,如表面上平緩的點高程插值,能得到令人滿意的結果。而在一段較短的水平距離內,表面值發生較大的變化,或無法確定采樣點數據的准確性,或差樣點數據具有很大的不確定性時,徑向基函數插值的方法並不適用。
五、地統計插值方法
地統計插值,也就是克里格插值。克里格方法(Kriging)又稱空間局部插值法,是以變異函數理論和結構分析為基礎,在有限區域內對區域變化量進行無偏最優估計的一種方法,是地統計學的主要內容之一。
1.克里格插值基礎
克里格方法和反距離權插值方法類似的是,兩者都通過對已知樣本點賦權重來求得未知樣點的值。不同的是,在賦權重時,反距離權插值方法只考慮已知樣本點與未知樣點的距離遠近,而克里格方法不僅考慮距離,而且通過變異函數和結構分析,考慮了已知樣本點的空間分布及與未知樣點的空間方位關系。
2.普通克里格插值
普通克里格插值(Ordinary Kriging)是區域化變量的線性估計,它假設數據變化成正態分布,認為區域變化量z的期望值是未知的。插值過程類似於加權滑動平均,權重值的確定來自於空間數據分析。
①創建預測圖(Prediction Map)
②創建分位數圖(Quantile Map)
③創建概率圖(Probability Map)
④創建標准誤差預測圖(Prediction Standard Error Map)
3.簡單克里格插值
簡單克里格插值就是區域化變量的線性估計,它假設數據變化成正態分布,認為區域化變量Z的期望值為已知的某一常數。
①創建預測圖(Prediction Map)
②創建分位數圖(Quantile Map)
③創建概率圖(Probability Map)
④創建標准誤差預測圖(Prediction Standard Error Map)
4.泛克里格插值
泛克里格假設數據中存在主導趨勢,且該趨勢可以用一個確定的函數或多項式來擬合。在進行泛克里格分析時,首先分析數據中存在的變化趨勢,獲得擬合模型;其次對殘差數據(即源數據減去趨勢數據)進行克里格分析;最后,將趨勢面分析和殘差分析的克里格結果相加和,得到最終結果。
由此可見,克里格方法明顯優於趨勢面分析,泛克里格的結果也要優於普通克里格的結果。
①創建預測圖(Prediction Map)
②創建分位數圖(Quantile Map)
③創建概率圖(Probability Map)
④創建標准誤差預測圖(Prediction Standard Error Map)
5.指示克里格插值
在很多情況下,並不需要了解區域內的每一個點的屬性值,而只需了解屬性值是否超過某一閾值,則可以將原始數據轉換為(0,1)值,選用指示克里值(Indicator Kriging)進行分析.
①創建概率圖(Probability Map)
②創建標准誤差預測圖(Prediction Standard Error Map)
6.概率克里格插值
①創建概率圖(Probability Map)
②創建標准誤差預測圖(Prediction Standard Error Map)
7.如果原始數據不服從簡單的分布(高斯或對數正態等),則可以選用析取克里格法(Disjunctive Kriging),他可以提供非線性估值方法。
①創建預測圖(Prediction Map)
②創建概率圖(Probability Map)
③創建標准誤差預測圖(Prediction Standard Error Map)
④創建標准誤差指示圖(Standard Error of Indicator Map)