Generate Network Spatial Weights
- 工具簡介
該工具會根據網絡的連通性來確定要素之間的權重關系,生成一個空間權重矩陣文件(swm)。如在計算兩點距離時,如果兩點之間的通行存在障礙,就不能用普通的歐幾里得距離來計算。
- 參數介紹
Input Feature Class:輸入的矢量點類型要素類,這些點之間會基於網絡空間關系來確定權重;
Unique ID Field:能夠唯一標示輸入點要素的整形字段;
Output Spatial Weights Matrix File:生成的空間權重矩陣文件(.swm格式);
Input Network:輸入的網絡數據集;
Impedance Attribute:阻抗的單位,由網絡數據集中指定;
Network Options
Impedance Cutoff:阻抗的距離;
Maximum Number of Neighbors:最多的鄰域個數;
Barriers:標識障礙的點要素類,如交通事故發生地等阻礙通行的地點;
U turn Policy:是否允許調頭,包括三個選項:ALLOW UTURNS— 任何地方都允許調頭;NO TURNS—不允許調頭;ALLOW DEAD ENDS ONLY U— 只有在死胡同處才允許調頭;
Weight Options
Conceptualization of Spatial Relationships:度量空間距離的方式,INVERSE離目標要素越遠權重越小;FIX在Impedance Cutoff范圍內權重都為1,超過為0;
Exponent:對於INVERSE方法,距離的指數;
Row Standardization:行標准化一般是在數據存在可能的偏見性的時候采用,一般是由於有偏采樣造成的。行標准化后每個要素的權重之和為1。
- 輸出結果
該工具輸出一個格式為swm的文件,在其他工具中指定空間距離關系時選擇GET_SPATIAL_WEIGHTS_FROM_FILE時可以指定,可以使用Convert Spatial Weights Matrix to Table轉換為表格查看。
Generate Spatial Weights Matrix
- 工具簡介
根據指定的空間距離關系生成swm格式的空間權重矩陣,或由ASCII格式的權重表格文件轉換成swm格式。一般來說,創建的權重有兩種類型,即二值權重矩陣,非0即1(如采用FIXED DISTANCE,K NEAREST NEIGHBOR);和不等的權重(如采用INVERSE DISTANCE)swm由於采用了稀疏矩陣的算法,會占用更少的存儲空間。
- 參數介紹
Input Feature Class:輸入的矢量點類型要素類,這些點之間會基於網絡空間關系來確定權重;
Unique ID Field:能夠唯一標示輸入點要素的整形字段;
Output Spatial Weights Matrix File:生成的空間權重矩陣文件(.swm格式);
- 輸出結果
該工具輸出一個格式為swm的文件,在其他工具中指定空間距離關系時選擇GET_SPATIAL_WEIGHTS_FROM_FILE時可以指定,可以使用Convert Spatial Weights Matrix to Table轉換為表格查看。
Ordinary Least Squares(OLS)
- 工具簡介
線性回歸的方法,為指定的一系列自變量和因變量擬合回歸方程,從而發現空間要素特征之間的聯系。根據自變量的不同,可分為二元線性回歸和多元線性回歸。如下圖所示,對於二元線性回歸而言,即為樣本中的點(x軸代表自變量值,y軸代表因變量的值)擬合一條盡可能經過大部分點的最佳的直線方程(殘差平方和最小),從而利用擬合的回歸方程對將來某個時刻或某個位置的要素狀態進行估計。
- 參數介紹
Input Feature Class:輸入的矢量要素類,屬性中包含自變量與因變量;
Unique ID Field:為每個要素指定一個能唯一標示的數值型字段;
Output Feature Class:輸出的要素類中包含回歸方程為每個自變量計算的估計值以及殘差;
Dependent Variable:自變量字段;
Explanatory Variable:因變量字段;
Coefficient Output Table:輸出表格中記錄每個自變量的系數;
Diagnostic Output Table:診斷表,記錄回歸方程的一些特征,如AIC,各個統計量的顯著性等,根據這些指標可以比較回歸方程的優劣。
- 輸出結果
輸出的要素類中包含輸入的每個要素,回歸方程為每個要素計算的估計值,殘差等。另外也會輸出回歸方程自變量系數,截距,T統計,BP統計等回歸模型的參數。
如何擬合回歸方程 ?
擬合回歸方程關鍵在於自變量的選擇,一般二元線性回歸的情況是比較少的,大多應用是多元線性回歸。因此選取幾個自變量,哪幾個自變量是最要關心的問題,往往需要通過多次嘗試才能達到一個好的狀態。對於OLS方法,工具會給出下面的結果解析:
判斷一個回歸方程“足夠好”的標准有以下幾個方面:
1、自變量的回歸系數的正負值(代表正相關與負相關)符合期望,可以看上表中的Coefficient;另外沒有冗余的自變量(VIF值較小,均不超過7.5);
2、自變量的回歸系數具有統計顯著性,看上表中StdError t-Statistic Porbability和Robust_Pr是否小於0.5(0.5的置信水平下進行驗證);
3、殘差服從正態分布(看上表中的Jarque-Bera Statistic零假設是否成立,該統計的零假設為服從正態分布);
4、殘差不具有空間自相關性(可以用Spatial Autocorelation工具對輸出結果中的殘差進行驗證);
5、具有較接近於1的R Squared值和較小的AIC。
Geographically Weighted Regression
- 工具簡介
地理加權是采用局部模型為每個要素建立線性回歸方程,來更好地模擬變量在空間上的變化情況。當自變量和因變量在空間上呈現非平穩性的時候,GWR比OLS更適合。
- 參數介紹
Input Feature Class:輸入的矢量要素類,屬性中包含自變量與因變量;
Dependent Field:因變量,數值型字段;
Explanatory Field:自變量,字段列表;
Out feature class:輸出要素類,包含回歸方程各個自變量的系數以及殘差;
Kernel type:定義空間尺度的方法,有FIXED(固定半徑法)和ADAPTIVE(可變半徑法);
Bandwidth method:空間尺度的計算方法。AICc(最小信息化原則來確定空間范圍);CV(交叉驗證來確定空間范圍);BANDWIDTH PARAMETER(指定半徑或確定的鄰居個數)
Distance:當Kernel type指定為FIXED,且Bandwidth method為BANDWIDTH PARAMETER時,指定的距離;
Number of neighbors:當Kernel type指定為ADAPTIVE,且Bandwidth method為BANDWIDTH PARAMETER時,指定的鄰居個數;
Weight field:為每個要素指定一個數值型字段,影響要素的重要程度;
Coefficient raster workspace:指定存放輸出系數柵格的路徑,柵格中存儲的是回歸方程中為每個自變量計算的系數;
Cell size:為上面輸出的柵格指定像元大小,默認的像元大小為環境變量中指定的空間范圍中較短的邊除以250;
In prediction locations:指定利用回歸方程所要估計的空間位置,該要素類中必須包含回歸方程中所有的自變量字段;
Prediction explanatory field:指定要估計的自變量列表,該列表中的字段必須和Dependent Field指定的內容和順序一致;
Out prediction feature class:利用回歸方程估計后輸出的要素類。
- 輸出結果
該工具會產生兩個要素類,輸出的Out feature class會為輸入的每個要素為擬合一個回歸方程,輸出每個自變量的回歸系數以及回歸方程的截距和殘差;Out prediction feature class則是為In prediction locations指定的要估計的每個空間要素為擬合一個回歸方程,輸出每個自變量的回歸系數以及回歸方程的截距和殘差
GWR or OLS ?
最小二乘法(OLS)僅是對變量“均值”估計,不能反映變量在空間上的非平穩性。采用地理加權回歸(GWR)技術引入空間效應,發現GWR模型比OLS模型具有明顯優勢。GWR能夠將數據的空間特性納入模型中,為每一個要素建立回歸方程,因而為反映數據的空間特征創造了條件。例如,要研究犯罪與教育程度之間的關系,會發現每個地區的影響因子是不同的,也就是說在空間上呈現非平穩性,因此采用GWR為每個要素建立起回歸方程是必要的。是否呈現空間的非平穩性可參考上表中的Koenker Statistics,其零假設即為在空間上是平穩的。