空間統計筆記之一(基礎知識)


  前段時間在學習空間統計相關的知識,於是把ArcGIS里Spatial Statistics工具箱里的工具好好研究了一遍,同時也整理了一些筆記上傳分享。這一篇先聊一些基礎概念,工具介紹篇隨后上傳。

  空間統計研究起步於上個世紀70年代,空間統計其核心就是認識與地理位置相關的數據間的空間依賴、空間關聯等關系,通過空間位置建立數據間的統計關系。空間統計學依賴於tablor地理學第一定律,即空間上越臨近的事物擁有越強的相似程度;和空間異質性,即空間位置差異造成的行為不確定現象。例如要度量犯罪率與教育程度的關系,不同地區 (文教區、貧困區)可能不一樣。

       利用GIS進行空間統計分析最早可追溯到1854年的倫敦大霍亂(黑死病)。當時盛行的理論是“空氣傳染”,而不是現在的病菌傳染。John Snow 醫生開始也相信空氣傳染學說,但證據使他不得不轉向病菌學說。他通過觀察霍亂病例在空間上分布的特征,找到了其空間上聚集的地方,進一步找到了致病的水井。利用空間統計可幫助我們發現、判斷並證實事物在空間上分布的規律和特征,從而對研究進行輔助決策。

 

幾個空間統計基本概念

  • 自相關指數

Moran指數和Geary系數是兩個用來度量空間自相關的全局指標。Moran指數反映的是空間鄰接或空間鄰近的區域單元屬性值的相似程度,Geary 系數與Moran指數存在負相關關系。 

Moran指數I的取值一般在[-1,1]之間,小於0表示負相關,等於0表示不相關,大於0表示正相關;

Geary系數C的取值一般在[0,2]之間,大於1表示負相關,等於1表示不相關,而小於1表示正相關;

 

  • 回歸分析

回歸分析(regression analysis)是確定兩個或多個變量間相互依賴的定量關系的一種統計分析方法。按照自變量和因變量之間的關系類型,可分為線性回歸分析和非線性回歸分析。如果在回歸分析中,只包括一個自變量和一個因變量,且二者的關系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個或兩個以上的自變量,且因變量和自變量之間是線性關系,則稱為多元線性回歸分析。

 

  •  歐幾里得距離&曼哈頓距離

歐幾里得距離即兩點之間平面直線距離,如果兩點的坐標分別為(x1,y1)和(x2,y2),則歐幾里得距離計算公式為:

而曼哈頓距離又稱為出租車距離,就是在歐幾里德空間的固定直角坐標系上兩點所形成的線段對軸產生的投影的距離總和,計算公式為:

                     Distance=|x1-x2|+|y1-y2|

  • 空間權重矩陣

通常定義一個二元對稱空間權重矩陣W,來表達n個位置的空間區域的鄰近關系,其形式如下:

                  

 Wij表示區域ij的臨近關系,它可以根據鄰接標准或距離標准來度量。  

常用的最簡單簡單的二進制鄰接矩陣

          

 常用的基於距離的二進制空間權重矩陣

            

  • Z Score和P

很多空間統計里的工具都會返回Z分數和P值,P值是統計學中所謂犯“第一類錯誤”的可能性,指零假設正確,而我們錯誤的拒絕了零假設的可能性。Z分數也代表拒絕零假設的可能性,也就是說,如果P值越小,Z分數的絕對值越大,就可以越放心的拒絕零假設。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM