空間統計(Spatial Statistics)學習筆記(一)— 概述


一、四大基礎理論

1 空間概率

空間概率是一種符合地理學第一定律的聯合概率joint probabilities
 
AB同時發生滑坡,比AD同時發生概率要高

2 概率密度(probability density)

測量值的偏差在任意方向都會出現一定的散布,而散布的概率理論上會形成正態分布的對稱曲線。在空間上可以把這個分布想象成一個鍾形,那么任何一個事件在任意區域發生的概率,就是這個鍾表面在這個區域上的所占的體積。

3 不確定性

不確定性可以傳遞— 數據的不確定性,最后肯定帶來結果的不確定性。
了解數據中不確定性和研究這些不確定性如何影響分析結果是重中之重。
比如地統計學,采用隨機過程來模擬插值的變異情況,就是不確定性研究的一項成果。

4 統計推斷 (statistical inference)

其通過樣本分析推理以求得到關於包括了樣本在內的更大群體的結論。
空間統計與經典統計最大的不同點就在於 要素之間的相關性,所以我們在做空間分析的時候,通常是在我們能夠獲得的所有數據上進行操作,因此很少或者更本沒有一個用於提取數據並進行推理的總體概念。而且認為每個樣本觀測值是獨立的觀點也是不行的,除非相距很遠。
所以空間分析很早就有了現在所謂的大數據分析的思路之一: 總體分析,局部驗證。
 

二、統計學主要內容

1 聚合- 整體性描述(Aggregation)

細節豐富但要有意識的抽象
常用的有眾數、中位數和均值等
在空間統計的領域里面,也有各類概念來表達,比如對於數據分布的整體描述,空間自相關,對於數據之間的差異性,有空間異質性等等。

2 信息- 度量與變化(Information Measurement)

抽樣過程中樣本數量和對象的選擇
但是在空間統計領域,因為空間自相關和空間異質性的存在,如何抽樣就成了一個新的大問題——如何保證抽樣出來的數據保有了原始數據的空間相關性和異質性,是一個大問題

3 似然- 概率尺度上的校准

似然度指的是在特定分布下出現的概率。具體指某件事在在限定的大背景下發生的概率。(貝葉斯概率?)
“傳統世界觀是決定論的、邏輯的,但統計世界觀是概率的,不可知的或可更新的”

4 相互比較- 樣本內的變異

有了面向背景目標的似然度,統計學可以解決外部比對問題,也就是跟預設分布去比較。然而,現實問題更多是數據內部的異質性所要求的內部比較,很多耳熟能詳的統計方法例如 t 檢驗、方差分析、Bootstrap 等都是用來解決內部比較問題的。

5 回歸- 多元分析、貝葉斯因果

事都會回歸到本來的樣子,規律性是松弛有度的。
空間統計里面,加入了地理加權回歸。但實際中,更多是用來做方法比較,或是回歸系數檢驗

6 設計- 實驗方案與隨機

7 殘差- 科學邏輯與模型比較

本質上科學就是通過解釋剩余現象進步,但是大家伙都在當前的噪音里探索未知信號的模式。具體到統計模型就是對模型解釋不了的部分與模型診斷的思想

三、空間統計學

空間分布模式:通常指的是帶有位置屬性的數據在一定的空間范圍內的分布規律
最開始采用樣方分析,后來出現了很多空間自相關的指數,如莫蘭指數,join count,Geary's C等。總之都是對一份數據進行全局性描述。
 
 
參考:
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM