全文轉自: https://blog.csdn.net/qq_43627659/article/details/108857378?utm_medium=distribute.pc_relevant.none-task-blog-title-2&spm=1001.2101.3001.4242
致謝:所有數據和方法都源自城市數據派MGWR課程主講於瀚辰老師
以下是於老師最近發表的相關論文
沈體雁,於瀚辰,周麟,古恆宇,何泓浩.北京市二手住宅價格影響機制——基於多尺度地理加權回歸模型(MGWR)的研究[J].經濟地理,2020,40(03):75-83.
一、效果圖
二、關於MGWR
MGWR(多尺度地理加權回歸)是由Stewart Fotheringham教授團隊開發,基於Microsoft Windows和MacOS的應用軟件,用於校准多尺度地理加權回歸(GWR)模型,該模型可用於探索因變量/響應變量與獨立/解釋變量的空間關系。它結合了廣泛使用的對空間異質性建模的方法-地理加權回歸(GWR)以及新提出的方法-多尺度GWR(MGWR),它放寬了對所有要建模的過程都在相同空間尺度上的假設。
三、MGWR軟件操作
1.軟件下載
MGWR為開源免費軟件,有需要的同學可以自行下載,也可以公眾號后台聯系我獲取安裝包
2.打開數據文件
3.界面展示
截距項(常數項)是指當所有其他變量確定后,地理位置變化(區位)對房價的影響。例如,靠近北京中心截距項高,靠近北京邊緣截距項低。從空間地理角度,研究位置(區位)對因變量是否有影響。
注:所有變量名稱都要用英文
4.軟件參數設置
標准化的優點:回歸結果更快,更穩定,系數更可信,常數項地理解釋更有含義。
標准化的缺點:標准化后,對除常數項外其余自變量的解釋較為復雜,可理解為,基於平均值的某個變量增加一個標准差,會對因變量產生怎樣的影響。作者建議,這個需要自己去權衡。
初始值:MGWR需要設定一個初始值,然后再去不斷優化初始值,最終收斂於某個值,選擇GWR收斂速度更快,所以一般選擇這個。
怎么判斷收斂?一共有兩種准則,SOC-f:前一次回歸系數和后一次回歸系數相差最大不超過收斂值,更加嚴格。SOC-RSS:前后兩次回歸的殘差平方和相差最大不會超過收斂值,較寬松。一般選擇SOC-f
注:
由於數據量(3000多個數據)過大,不再去探究是否存在空間變異性,不去做蒙特卡洛模擬,局部共線性問題也可不做。
5.得到結果
電腦配置越高,運行速度越快,作者花了15min,而我花了將近30min
運行成功后會得到:一個excel文件和記事本格式文件
四、MGWR結果解讀
1.初步結果分析
(1)基礎信息描述
(2)GWR初步結果
(3)MGWR初步結果
注:帶寬可理解為,估計的點需要使用周圍多少個點進行回歸。固定帶寬:確定一個帶寬比如50m,所有區域均采用這個帶寬,容易出現有些區域點過於密集,有些區域點過於稀疏。自適應帶寬:沒有固定的帶寬,依據點的個數而定。比如每個區域都用50個點進行回歸,可能有的區域僅需帶寬50m就能包含50個點,有的區域則需要帶寬100m才能包含50個點。
MGWR特點:不同變量不同帶寬,就相當於不同尺度,有的接近全局,有的是局部。有效參數個數可為小數,這個是OLS所不能做到的。每個變量有自己的t統計量標准,不一定是和1.96相比,所以回歸結果更可信。自由度,數值越大自由度越大,越小自由度越小。對於地理加權回歸而言最重要的就是尺度!尺度!尺度!
(4)MGWR基礎信息
2.MGWR具體回歸結果
會得到一個excel表格,里面包含所有的回歸結果
注:最重要的幾個值就是t統計量、p值和估計系數
五、MGWR結果可視化
1.分析
需要分別對每個變量的系數進行可視化,采用的方法就是通過arcgis將點和圖層結合,並按大小進行分類,本文選擇area這個變量進行可視化
2.轉化成CSV文件
在excel中將自變量area回歸結果中p值小於0.05的部分復制,導入新的excel,並另存為csv格式文件
3.導入到arcgis中
打開arcgis,添加北京城市公路shp和area數據的csv文件
4.顯示X,Y數據,更換坐標系
5.使用符號系統進行分類,方法可參照往期推送
可以發現area回歸的系數在空間上的分布特征,具體解讀請參考作者發表的論文,本文僅是討論MGWR操作實現方法。
文章地址: