地理探测器学习GeoDector


空间分异是自然和社会经济过程的空间表现,也是自亚里士多德依赖人类认识自然的重要途径。

 

空间分异性,全称空间分层异质性(spatial stratified heterogeneity),是指某一属性值在不同类型或区域之间存在差异,例如土地利用图、气候分带、生态分区、地理区划等等。空间分异可用地理探测器q-statistic来识别、检验、寻找和归因。

空间分层异质性,简称空间分异性,是指层内方差小于层间方差的地理现象,例如地理分区、气候带、土地利用图、地貌图、生物区系、区际经济差异、城乡差异以及主体功能区等等,是空间数据的另一大特性。

 

地理探测器是探测空间分异性,以及揭示其背后驱动因子的一种新的统计学方法,此方法无线性假设,具有优雅的形式和明确的物理含义。

基本思想是:假设研究区分为若干子区域,如果子区域的方差之和小于区域总方差,则存在空间分异性;如果两变量的空间分布趋于一致,则两者存在统计关联性。地理探测器q统计量,可用以度量空间分异性、探测解释因子、分析变量之间交互关系,已经在自然和社会科学多领域应用。

使用地理探测器来认识、挖掘和利用空间分异性。

针对空间分异性的统计学方法,有空间分异性测度和因子分析的地理探测器q统计;在不同样本条件下的区域总量估算、空间插值和空间抽样的系列统计量:当有分层样本时的MSN、当样本有偏时的Bshade、当只有单样本点时的SPA模型、小样本多单元报告以及多边形图层之间的互相转换的Sandwich模型。

 

地理探测器是探测空间分异性,以及揭示其背后驱动力的一组统计学方法。其核心思想是基于这样的假设:如果某个自变量对某个因变量有重要影响,那么自变量和因变量的空间分布应具有相似性。X和Y。

地理分异既可以用分类算法来表达,例如环境遥感分类;也可以根据经验确定,例如胡焕庸线。地理探测器擅长分析类型量,而对于顺序量、比值量或间隔量,只要进行适当的离散化,也可以利用地理探测器对其进行统计分析。

因此,地理探测器既可以探测数值型数据,也可以探测定性数据,这正是地理探测器的一大优势。地理探测器是另一个独特优势是探测两因子交互作用于因变量。交互作用一般的识别方法是在回归模型中增加两因子的乘积项,检验其统计显著性。然而,两因子交互作用不一定就是相乘关系。地理探测器通过分别计算和比较各单因子q值及两因子叠加后的q值,可以判断两因子是否存在交互作用,以及交互作用的强弱、方向、线性还是非线性等。两因子叠加既包括相乘关系,也包括其他关系,只要有关系,就能检验出来。

 

阐述地理探测器的基本原理,介绍地理探测器软件;通过对比分析地理探测器在自然科学、社会科学、环境科学和人类健康方面的几个典型应用案例,讨论了地理探测器的使用条件和优势,提出了可能遇到问题的对策。

 

1.地理探测器原理

空间分异性是地理现象的基本特点之一。地理探测器是探测和利用空间分异性的工具。地理探测器包括4个探测器。

分异及因子探测:探测Y的空间分异性;以及探测某因子X多大程度上解释了属性Y的空间分异(图1)。用q值度量。

交互作用探测器:识别不同风险因子Xs之间的交互作用,即评估因子X1和X2共同作用时是否会增加或减弱对因变量Y的解释力,或这些因子对Y的影响是相互独立的。评估的方法是首先分别计算两种因子X1和X2对Y的q值:q(X1)和q(X2),并计算它们交互(叠加变量X1和X2两个图层相切所形成的新的多边形分布)时的q值:q(X1∩X2),并对q(X1)、q(X2)与q(X1∩X2)进行比较。两个因子之间的关系可分为以下几类:

风险区探测:用于判断两个子区域间的属性均值是否有显著的差别,用t统计量来检验。

生态探测:用于比较两因子X1和X2对属性Y的空间分布的影响是否有显著的差异,以F统计量来衡量。

 

2.地理探测器软件

下载官网:www.geodetector.cn/

使用步骤:

(1)数据的收集与整理:这些数据包括因变量Y和自变量数据X。自变量应为类型量;如果自变量为数值量,则需要进行离散化处理。离散可以基于专家知识,也可以直接等分或使用分类算法如K-means等。

(2)将样本(Y,X)读入地理探测器软件,然后运行软件,结果包括4个部分:比较俩区域因变量均值是否有显著差异;自变量X对因变量的解释力;不同自变量对因变量的影响是否有显著的差异,以及这些自变量对因变量影响的交互作用。

地理探测器探测两变量Y和X的关系时,对于面数据(多边形数据)和点数据,有不同的处理方式。

对于面数据,两变量Y和X的空间粒度经常是不同的。例如,因变量Y为疾病数据,一般以行政单元记录;环境自变量或其代理变量X的空间格局往往是循自然或经济社会因素而形成的,如不同水文流域、地形分区、城乡分区等。

对于点数据:如果观测数据是通过随机抽样或系统抽样而得到,并且样本量足够大,可以代表总体,则可以直接利用此数据在地理探测器软件中进行计算。如果样本有偏,不能代表总体,则需要用一些纠偏的方法来对数据进一步的处理之后再在地理探测器软件中进行计算。

 

3.应用案例

4.结论与探讨

 

 

 

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM