地理信息系統(GIS) 知識詳解


文章目錄

地理信息系統(GIS) 知識詳解

第二章、地理信息系統的空間數據結構和數據庫

2.0. 簡述*:

1.地理信息系統的對象是空間的地理實體
2.建立一個地理信息數據庫的首要任務是建立空間數據庫,即反映地理實體特性的地理數據存儲在計算機
3.需要解決的問題:
(1)地理數據具體以什么形式在計算機中存儲和處理
(2)主要學習空間數據結構和空間數據庫模型

2.0.1 什么是地理信息系統?

GIS是由計算機硬件、軟件、和不同方法組成的系統,該系統用來支持空間數據的采集、管理、處理、分析、建模和顯示、便於解決復雜的規划和管理問題

2.1 空間數據結構

2.1.1 概述

(1)地理實體

指的是人們生存的地球表面附近的地理圖層可以相互區分的事物和現象

(2)地理實體的表達

由矢量表示法和柵格表示法構成

(3)地理實體的特征*

1.屬性特征:用以描述事物或現象的特性
2.空間特征:描述事物或者現象的地理位置以及空間的相互關系
3.時間特征:描述事物或現象隨時間的變化

(4) 地理實體數據的類型

1.屬性數據:描述地理實體的屬性特征的數據,也叫做非幾何數據
2.幾何數據:描述地理實體的空間特征的數據,也叫做位置數據,定位數據
3.關系數據:描述地理實體之間的空間關系的數據。主要指拓撲關系

(5) 拓撲關系的種類*

1.關聯:不同類型的要素的聯系
2.鄰接:相同類型的要素的聯系
3.包含關系:面與其他拓撲元素之間的關系
4.層次關系:相同拓撲元素的等級關系(道路分等級,城市的點分等級)
5.連通關系:拓撲元素之間的通達關系

(6)空間數據結構

空間數據的編排方式和組織關系

2.1.2 矢量數據結構

什么是矢量數據結構?
通過坐標來精確的表示點線面等地理實體的一種數據結構
點:通過一個坐標來表示;
線:通過一串有序的坐標對表示;
面:由一串有序並且首尾點的坐標相同的坐標對和面表示符組成;

(1)shapefile介紹

一種存儲地理要素的屬性信息和幾何位置的簡單格式;
分為.shp存儲幾何要素;.shx幾何索引文件;.dbf屬性信息文件;

(2)矢量數據的獲取方式

1.外業測量
2.柵格數據的轉換:柵格矢量化到弧段數據,弧段自動生成多變形
3.跟蹤數字化

(3)歐拉定理

L + 2 = A + P (Line + 2 = Area + Point)

(4)拓撲關系的表示

面:構成面的鏈的順時針表示
鏈:鏈兩端結點(起點,終點)
結點-鏈的關系:通過結點的鏈(流入,流出)
鏈-面的關系:(左面,右面)鏈的左邊在哪兒個面,右邊在哪兒個面

2.1.3 柵格數據結構

(1)柵格數據結構的定義

柵格數據結構(網狀結構,像元結構);
用規則的像元矩陣表示空間地物或現象的分布的數據結構,陣列中的每個數據表示地物或現象的屬性特征;

(2)特點

操作簡單,處理起來速度快;
容易與遙感數據相互結合;

(3)獲取方式

1.矢量數據轉換而來;
2.遙感數據;
3.掃描地圖
4.手工方法獲取;

(4)柵格屬性值的確定-由手工方法獲取到的柵格數據

1.中心歸屬法
2.長度占優法
3.面積占優法
4.重要性法

2.1.4 矢量-柵格一體化數據結構

(1)矢量柵格數據結構的優缺點

矢量數據:描述地理實體非常精確,結構緊湊,冗余度底,但是數據結構復雜,處理起來對硬件要求較高;
柵格數據:結構簡單、便於數據的處理,但是數據量大,圖形的質量低,有鋸齒感;
在這里插入圖片描述

(2)矢量柵格一體化的概念

點,線,面的地物可以保持矢量的特性,元子空間充填表達建立了位置與地物的關系,使得要素具有了柵格的特性

(3)矢量柵格一體化中點、線、面的三個約定

點:只有位置,沒有形狀和面積
線:有形狀沒有面積
面:有形狀和面積

(4)提高一體化精度

1.細分格網法:格網進行加密
2.線性四叉樹編碼,采樣點和線性目標與基本格網的交點用兩個Morton碼表示

(5)矢量柵格一體化數據結構的設計
  • 線性四叉樹(主要的目的是進行壓縮處理)
    對於一個四叉樹,2^n * 2^n ,最深的層數是n;
    四叉樹分為樹杈結點(可以再分)和葉節點(不可以再分);
    壓縮過程:
    在這里插入圖片描述
    在這里插入圖片描述
  • 點線面的三個約定
  • 細分格網法
  • Morton編碼規則
    行號和列號都用四位二進制表示,行號為第一個,列號為第二個,依次按順序向下
    在這里插入圖片描述
    在這里插入圖片描述
    M碼 n = 3 時,表格的形式,從 0 行 0 列開始

2.1.5 三維數據結構

2.2 GIS的數據模型

數據庫的基本知識:
組成:數據集,物理存儲介質,數據庫軟件;
數據庫中的常用概念:Entity Attribute Key Domain EntityType ;
數據庫管理系統,叫做DBMS,具有數據庫的定義,管理,和維護等功能

2.2.1 概述

2.2.2 層次數據模型

層次數據模型是一種樹結構模型,數據按照自然的層次關系組織起來,反映數據之間的隸屬關系,雙親結點和子結點是1對多,結點之間不相交;
樹結構為一種層次結構:四叉樹向下分的方向有,北西 北東 南西 南東(從左到右,從上到下),圓的是樹杈結點,可以再分,方的是子結點,不可以再分

2.2.3 網狀數據模型

將數據組成有方向的圖,結點代表數據記錄,連線描述結點數據之間的關系

2.2.4 關系數據模型

每一個實體代表一行,相當於Excel中的每一行的表格

2.2.5 對象數據模型

編程實現的面相對象編程,抽象性,封裝性,多態性

2.2.6 時空數據模型

時空地理信息系統(TGIS),以表達,管理和分析動態變化的地理現象為目的,核心是時空數據庫;

類型有:連續快照類型,地圖疊加,時空合成模型

2.3 數據的管理模式

2.3.1 數據的管理模式

2.3.2 空間數據庫設計、建立和維護

表示概念模型最有力的工具是E-R模型,包括實體,聯系和屬性三個基本成分

第三章、空間數據的采集和質量控制

1.概述

(1)GIS數據來源

地圖數據;
遙感數據;
文本資料:法律文檔,行業規范;
實測數據;
統計資料:人口、基礎設施的統計數據;
多媒體數據:聲音、錄像;
已有系統的數據:其他建成的系統的數據;

(2)空間數據采集的主要任務

將現有地圖、外業觀測成果、航空像片、遙感圖像、文本資料等轉換為GIS可以識別與接受的數字形式,通常需要驗證、修改、編輯等處理

(3)研究GIS數據質量的目的和意義

什么是GIS數據質量?
GIS中空間數據的可靠性,通常使用空間數據的誤差來度量;

目的:建立一套空間數據處理和分析的體系,建立GIS產品的合格證制度;

意義:評定GIS質量,評判算法優差,減少GIS設計與開發的盲目性

2.空間數據的地理參照系和控制基礎

3.地理實體分類和數據編碼

地理實體分類

什么是地理實體?

指的是在現實世界中,不能再划分為同類現象的現象(城市不能再划分為城市,但是可以划分為街道,區域)

什么是地理目標?

實體在地理數據庫中的表示

地理實體的類型有?

點實體:具有特定的位置,沒有長度的實體
線實體:具有長度的實體,比如線段,邊界等,並且具有長度,曲率,方向等特征;
面實體:也叫做多變形、區域等,其具有的特征有面積,周長,獨立或者相鄰,重疊與否等特征;
體實體:用於描述三維空間中的現象與物體,具有長度寬度,高度等屬性;
上面的地理實體可以使用0 1 2 3維 來進行表示(點,線,面,體);

地理實體的描述內容

編碼:唯一標示;
位置:地理實體的具體的空間位置;
類型:地理實體屬於什么實體類型;
行為:地理實體具有的行為和功能;
屬性:地理實體對應的非空間信息,比如道路的寬度,路面質量,車流量等;
說明:說明地理實體數據的來源,質量等信息;
時間維描述:地理實體的屬性或空間位置隨時間的變化;
關系:與其他地理實體之間的關系;

根據地理實體的特征,將地理實體數據分為三類

屬性數據:描述地理實體是什么;
幾何數據:描述地理實體的空間特征,實體在哪兒里;
關系數據:描述地理實體之間的相互關系,拓撲關系等;

地理目標數據的分層

什么是圖層?
按照某種屬性特征形成的一個數據層,比如字體圖層,點的圖層

為什么要分層?
為了方便數據的管理、查詢、顯示、分析

怎么分層?
按照專題分層:每個圖層包含一個專題,包含某一類數據;
按照時間序列分層:不同時間,不同時期的數據分別構成各個數據層

地理編碼

什么是地理編碼?
對地理實體中的屬性數據的編碼,通過唯一的標示碼與幾何數據聯系起來

屬性數據的分類、分級
分類:
屬性數據的分類原則:科學性、系統性、可擴性、使用性、兼容性
分類方法:線分類法(按照屬性分為不同等級)、面分類法(按照屬性分為不相關的面)

分級:數學方法,數列分級,最優分割分級

GIS中代碼的種類:分類碼(標識不同類別的數據),標識碼(關鍵字)

代碼的功能:鑒別、分類、排序

編碼的基本原則:唯一性、合理性、可擴性、簡單性、適用性、規范性

代碼的類型:數字型、字母型、數字字母混合型

4.空間數據的采集

(1)地圖數字化

將紙質或其他材料的地圖,轉換為計算機可以識別的圖形數據的過程

數字化方法:地圖追蹤數字化、地圖掃描數字化;

(2)空間數據的檢核

檢核內容:
數據的不完整;
幾何數據不正確;
比例尺不正確;
變形;
幾何數據與屬性數據連接有誤;

5.GIS 數據質量

5.1 GIS數據質量的內容(衡量質量的指標)

1.位置精度:坐標的精度
2.屬性精度:屬性數據的質量
3.邏輯一致性:多變形的閉合精度,結點匹配精度等
4.完備性:數據分類的完備性
5.現勢性:采集時間,更新時間

5.2 GIS空間數據的誤差類型

源誤差:指的是數據采集和錄入時產生的誤差;
遙感數據:
測量數據:
屬性數據:
GPS數據:
地圖:
地圖數字化精度:

處理誤差:GIS對空間數據處理時產生的誤差;
幾何糾正:
坐標轉換:
幾何數據的編輯:
屬性數據的編輯:
空間分析:多變形的疊置;
數據格式轉換:
計算機截斷誤差:
空間內插誤差;

數據處理中數據質量評價

1.數字高程DEM的精度
2.矢量數據柵格化誤差:像元越大,誤差越大
3.多變形重疊產生的誤差:匹配誤差,幾何誤差,和屬性誤差

6.空間數據標准

空間數據交換標准

1.外部數據交換標准
2.空間數據相互操作協議
3.空間數據共享平台
4.統一數據庫接口

空間元數據

元數據:關於數據的數據,描述數據和信息資源的數據
空間元數據:關於地理的數據和信息資源的描述性信息

第四章、空間數據處理

一、矢量拓撲關系的自動建立

1.點、線拓撲關系的自動建立

結點與鏈的關系;
結點與起點、終點的關系;

2.多變形拓撲關系的自動建立

(1)鏈的組織

中間相交,切斷,然后順序編號

(2)結點匹配

一定限差中的鏈的端點作為一個結點,坐標值取多個端點的平均值;

(3)檢查多變形是否閉合

(3.1)不閉合的原因:匹配結點誤差的問題,數字化誤差較大,本身就是懸掛鏈,不參加拓撲

(4)建立多變形

(4.1)順時針方向構建多變形:多邊形在鏈的右側
(4.2)從一條鏈的端點出發,選擇在這條鏈的的方向上的最右邊第一條鏈,作為下一條鏈
(4.3)要使得所走的是一個封閉路線,要么選前進方向上的最右邊的鏈,要么選擇左邊第一條鏈(前進方向是起始端點和選定的鏈的另一個鏈的端點的連線,優先選擇鏈的前進方向上的最右邊的鏈 )

(5)面積的正負問題

順時針為正,逆時針為負

(6)島的判斷 (NaN)

在這里插入圖片描述

(7)確定多邊形的屬性

內點與多變形匹配后,內點的屬性常賦值於多變形

二、圖形編輯

(1)點的捕捉

設置光標點的坐標是:(x,y),某一個需要捕捉的要素的坐標是(X,Y),有兩種計算方法,d = sqrt((X - x)^2 + (Y - y)^ 2),此種方法,計算時間較長,作為改進,使用d = max(|X - x|,|Y - y|),可以大大的加快運算速度。

(2)線的捕捉

假設光標點的坐標是:(x,y),線的每一個小結點的坐標是:(xn,yn),利用點到直線的距離公示,可以計算出最短的距離,設置捕捉半徑,即可以捕捉到,公示簡化為 Min(dx,dy) ,dx,dy是光標到直線段的水平距離和垂直距離,取到其中較小的,與捕捉半徑相互比較,符合,則進行捕捉。

(3)面的捕捉

實際上是判斷光標點是否存在於多變形內部。
使用方法:垂線法
從光標點向下方做垂線,計算其交點,交點為奇數,在面的內部,偶數,不在面的內部,有一種特殊情況,垂線經過兩個邊的交點,此時看交於一點的兩條邊是在垂線的同側還是異側,同側則不算交點,異側,算一個交點

(4)圖形編輯的數據組織-空間索引

目的:為了加快檢索,需要進行分層建索引,主要方法有格網索引四叉樹索引;

格網索引:
每個要素在一個或者多個格網中;
每個網格含有多個要素;
要素不真正被網格分割;

三、空間數據的坐標轉換

(1)幾何糾正

圖形編輯時,只能消除數字化產生的明顯的誤差,對圖紙變形以及其他原因產生的誤差難以改正,所以需要幾何糾正

(1.1)高次變換

多項式的最高次冪大於2;

(1.2)二次變換

不包括多項式最高次冪大於2的多項式

(1.3)仿射變換

特性:
直線變換完成仍為直線;
平行直線變換完成仍為平行線;
不同方向的長度比發生變化;

(2)投影變換

(2.1)解析變換法:反解變換法,正解變換法
(2.2)數值變換法
(2.3)數值解析變換法

四、空間數據的壓縮處理

(1)矢量數據壓縮

(1.1)道格拉斯-普克法

在這里插入圖片描述
第一步:A B 兩個端點進行連接成線段AB(虛線)
第二步:每一個點對上一步的虛線作垂線,求出點到直線的距離
第三步:判斷,找到垂線中,點到直線 AB 距離最大的點(顯然 P 點滿足),連接成虛線即連接 AP,PB ,繼續判斷小於 P 到直線 AB 的垂直距離的最大值,即 N ,連接 AN NP PB ,此時 N 的垂距任然大於限差 ,繼續尋找,發現其他的點到 AB 的垂直距離均小於限差,所以依次連接 A N C P B ,壓縮完成

(1.2)垂距法

第一步:從點號下標為 1 的點開始,將下標為奇數的點用虛線連接起來(即連接p1p3,p3p5,p5p7等),下標為偶數的點作其相鄰的兩個下標為奇數的點所連接成的直線的垂線(舉例:p2作p1p3的垂線),如果點(p2)到直線(p1p3)的距離大於限差,保留,小於的話刪除這個偶數點(即連接偶數點相鄰的奇數點,連接p13p3,將p2舍去,達到壓縮的目的)
在這里插入圖片描述

(1.3)光欄法

在這里插入圖片描述
簡單來講:有一條折線,折線的有的細節(折點太多)可以壓縮掉,節省一點空間;具體的壓縮方式如下:
1.自己設定一個光欄口徑,上圖的 d (扇形開口的大小,也可以叫做限差),d 垂直於起始折線p1p2。在距離p1p2的1 / 2d 處取得a1和a2兩個點,連接p1a1和p2a2,此時形成了一個扇形區域;

2.看扇形區域內部除了折點p2外,看有沒有折點,上圖的綠色區域顯然 點 p3 在內部,此時直接連接p1p3,將p2點舍去,達到了壓縮的效果(就是刪除不需要的細節);

3.連接好p1p3后,繼續作和第一步相似的光欄,此時形成的新扇形(扇形也可以叫做光欄)是:b1p1b2;在看在扇形區域(b1p1b2)內部有無折點,有則直接連接p1到在扇形區域的新找到的折點,沒有進行第四步;

4.前三步都完成了說明 p1 點的壓縮完成,此時進行p3點的扇形壓縮,重復上面步驟即可;

(2)柵格數據壓縮的幾種方法

(2.1)四叉樹編碼

四叉樹編碼分為十進制和四進制兩種,十進制四叉樹的地址碼叫做Morton碼(M碼是從 0 行 0 列開始的,切記)
使用四叉樹編碼,需要繪制四叉樹,繪制時需要注意:
1.四叉樹有樹杈結點和葉節點;
2.葉節點習慣用方塊表示並且不可以再分;
3.樹杈結點習慣用小圓圈表示並且可以繼續分;
4.樹杈結點與葉結點之間的連接使用北西(NW),北東(NE),南西(SW),南東(SE);

(2.2.1)四叉樹編碼流程

1.按照地址碼(即 M 碼)用計算機語言讀入圖像的像元、將像元(值)放在一個一維的數組中

2.將上一步的所有數組分為四大塊
舉例:比如 16 個地址碼(每一個地址碼對應一個值,值可以相等,也可以不相等)讀取進來,假設分為[A A A A] ,[B A A B],[C A B B],[ A B C A],(編程語言數組從 0 開始索引,所以索引下標是 0 到 15)

3.觀察分為的這四個小數組,看數組中有沒有值相同的,如果有,則進行合並,上面的數組可以合並為[A],[B A A B],[C A B B],[ A B C A],(因為第一個小數組都是 A 所以合並成一個 A 這樣子就節省了存儲空間,達到了壓縮的目的)

(2.2)游程編碼流程(也叫做行程編碼)

在上面的(2.2.1)的第 3 步,已經完成了四叉樹的編碼,此時,還沒有到達最大的壓縮,此時游程編碼閃亮登場,它的主要思想是,只要有相鄰元素是相同的,就只記錄這些相同元素的第一個的地址碼存儲
舉例:還是上面的例子:
1.經過四叉樹編碼后的數組以及數組中的值的索引:
[A B A A B C A B B A B C A]
[0 4 5 6 7 8 9 10 11 12 13 14 15]

2.此時游程編碼(只記錄這些相同元素的第一個的地址碼):
[A B A B C A B A B C A]
[0 4 5 7 8 9 10 12 13 14 15]

(2.3)直接柵格法

將柵格數據看作數據矩陣,從左到右,從上到下,記錄即可
舉例:
A A A A
B B A A
C C A A
C C B B
直接柵格后:A A A A B B A A C C A A C C B B(粗暴簡單,數據量較大)

五、等高線的繪制注意事項

(2.1)等高線的種類

首曲線:首曲線,又叫基本等高線。是按基本等高距測繪的等高線,一般用細實線(0.15mm)描繪,是表示地貌狀態的主要等高線。

計曲線:計曲線,又叫加粗等高線。為了便於判讀等高線的高程,自高程起算面開始,每隔4條首曲線加粗描繪的等高線。一般用粗實線(0.3mm)並在適當位置斷開注記高程。字頭沖北方向,計曲線是辨認等高線高程的依據。(兩條計曲線之間的差值是等高距的 5 倍)

間曲線:間曲線,又叫半距等高線。當首曲線不能顯示某些局部地貌時,按二分之一等高距描繪的等高線。一般用細長虛線,盡在局部地區使用,可不閉合,但應對稱。

助曲線:助曲線,又叫輔助等高線,是按四分之一等高距描繪的細短虛線,用以顯示間曲線仍不能顯示的某段微型地貌。

(2.2)首曲線與計曲線之間的區別

1、首曲線按基本等高距繪出的等高線;
2、為了閱讀方便,從起點起,每隔四根等高線(首曲線)加粗描繪一根等高線,這根加粗的等高線就是計曲線(又叫加粗等高線);在地形圖上以0.2mm的粗實線描繪,這樣做便於查算點的高程或者兩點間的高差;

六、空間數據的插值方法

1.空間數據的插值

為什么插值?
給未知的數據給出合理的預判值

概述
內插:在已知觀測點的區域內估算未知點的數據的過程;
外推:在已知觀測點的區域外估算未知點的數據的過程;
在這里插入圖片描述

(1)邊界內插

前提條件:假定發生重要的變化都產生在區域的邊界上,邊界內部的變化是均勻的、同質的,代表性的插值方法是泰森多邊形,基本的原理是:未知點的最佳值最臨近的觀測值產生

(2)趨勢面分析

概述:是一種多項式回歸分析技術。多項式回歸的基本思想是用多項式表示線或者面,使用最小二乘的原理對數據點進行擬合,擬合的時候假定數據點的空間坐標X,Y為獨立變量,表示特征值的Z坐標為因變量。
在這里插入圖片描述

(3)局部內插

利用局部范圍內的已知采樣點的數據內插未知點的數據
在這里插入圖片描述

(4)移動平均法(待更)

2.數字高程模型的生成

(1)數字高程的概念

數字高程模型:(DEM)Digital Elevation model , 研究空間起伏變化的連續表示方法
數字地面模型:(DTM)Digital Terrain Model , 含有地面起伏和屬性(坡度,坡向)兩個含義,是DEM的進一步分析

(2)DEM的表示方法

1.等值線表示
2.格網DEM,點模式表示
3.不規則三角網DEM(TIN),可以較少平坦區域的數據冗余

(3)格網DEM的建立方式

1.離散點構建格網
在這里插入圖片描述
2.線性內插或者雙線性內插
3.距離加權法
在這里插入圖片描述
4.離散點的選取
方法:假設圖幅的面積為 A ,具有 N 個數據點,每一個離散點的平均面積是:A0 = A / N ,那么選取K個離散點,正方形初始面積應該為A1 = K * A0 = D * D

(4)不規則三角網DEM的建立(important)

1.構建三角網的要求
盡可能的保證每個三角形是銳角;
三角形三邊的長度近似相等;
避免出現過大的鈍角和過小的銳角;

2.構建三角網的過程

在這里插入圖片描述
(1)選取距離最近的兩個點作為三角形的兩個頂點
(2)使用余弦定理選擇第三個頂點,使得角度最大(求取余弦值的最大值,即角度最大)
在這里插入圖片描述
(3)三角形向外擴展,擴展時需要對異側進行判斷,求出下圖線段p1p2的方程,將p3與p的坐標(x,y)代入,滿足判別式f(x,y) * f(x3,y3) < 0;說明在異側,p 點可以擴展
在這里插入圖片描述
(4)檢查:一條邊最多只能是兩個三角形的公共邊,檢查三角形的三邊是否被用過兩次,大於2次以上,擴展無效。

第五章、空間查詢與空間分析

在這里插入圖片描述

假設自己為農業部門選出一個適合生長在山的陰坡的植物的地理位置,請使用學過的知識進行合理的解決

(1)准備資料有:
當地的非城市用地數字高程模型(DEM),為了后面的計算坡度(選擇坡度較低的地區),坡向(選擇山的陰面);
當地的交通路網矢量圖有公路,鐵路,方便解決后期的果實的運輸(緩沖區分析,計算交集);
找出當地的水系圖,方便后期的澆水;
(2)對已知的數據的操作
緩沖區分析,求解坡度、坡向、計算緩沖區的交集,計算選址的面積,使用空間查詢

第一節、空間數據庫的查詢

1.空間數據查詢的含義

一般定義:從數據庫找出滿足屬性約束條件空間約束條件地理對象或數據內容

分類
1.針對空間特征的查詢
2.針對非空間特征的查詢
3.結合空間特征和非空間特征的查詢

2.空間數據查詢的方式

1.基於關系數據庫的查詢(SQL)擴充的空間查詢
舉例:
SELECT *
FROM 縣或市
WHERE 縣或市.人口 > 50 萬 AND THTOUGE = ‘長江’
從某個數據庫中選中所有的屬性,where 后面添加選定條件

2.可視化空間查詢
在這里插入圖片描述
畫圖直觀的看出,數據之間的關系,上圖體現在點線面之間的關系

3.超文本查詢
html 相當於超鏈接的存在,可以提前設置好,需要的內容自己點擊

4.基於自然語言的查詢
SQL 查詢中引用一些人說的話(自然語言)
SELECT name
FROM Cities
WHERE temperture is high

第二節、空間數據(屬性)的統計分析

在這里插入圖片描述

1.屬性數據的集中特征數

(1)頻數和平均數
(2)中位數
(3)眾數
(4)數學期望:數據的可能取值與概率的乘積,簡單算數平均的一種推廣,類似加權平均

2.屬性數據的離散特征數

(1)極差:最大與最小之差
(2)離差:一組數據中,各數據值與平均數之差
(3)方差與標准差
在這里插入圖片描述
在這里插入圖片描述
(4)變差系數:用來衡量數據在時間和空間上的相對變化的程度,無量綱

在這里插入圖片描述

3.統計數據的分類分級

(1)系統聚類法

1.有 n 個樣本 有n 個類別,計算類與類之間的距離;
2.將距離最小的兩個類合並成一個類,此時有 n - 1 個類;
3.循環計算,直到到達指定的分類的數目或者分為一類
4.分別計算樣本之間的距離( k 看作是列,i j 看作是行
在這里插入圖片描述
如果遇到的某個屬性的值相對其他屬性很大,可以進行下面的歸一化操作(標准化,正規化)
在這里插入圖片描述

2.最優分割等級法

概述:針對有序樣本或者可變為有序(排序)的樣本
在這里插入圖片描述
問題一:n 個數據分為 n 個等級需要(n - 1)個空隙
問題二:分為 k 級需要的空隙是 (k - 1)
問題三:排列組合 C(n- 1)(k - 1)
問題四:滿足級內的離差平方和最小,級外離差平方和最大即可

第三節、DEM分析

1.基於DEM的信息提取------坡度坡向的計算

坡度:某點在曲面上的法線方向垂直方向之間的夾角
坡向法線的正方向在平面上的投影正北方向的夾角,范圍是:0~360°
在這里插入圖片描述
計算方法如下:
在這里插入圖片描述

2.基於DEM的可視化分析

剖面分析

第四節、空間數據的疊置分析

什么是疊置分析?
將同一地區的兩組或者兩組以上的要素進行疊置,產生新的特征(新的空間圖形或者空間位置上的新屬性的過程)的分析方法

1.基於矢量數據的疊置分析

點與多邊形的疊置:判斷點是否在面內
線與多邊形的疊置:線的多邊形裁剪

2.基於柵格數據的疊置分析

(2.1)單層柵格數據的疊置分析

概述:對原始圖層的一系列的處理得到行的具有特殊意義的圖層的過程

1.布爾邏輯運算

2.重分類
將屬性數據的類別合並或者轉化為新類
舉例:將土壤類型重分類為水面和陸地兩種類型
類別合並:由復雜到簡單
3.濾波運算
通過移動窗口,對柵格數據作過濾處理,求解中央像元的新值(Z)
在這里插入圖片描述
4.特征參數計算
使用柵格數據計算區域的周長、面積、重心、線的長度,點的坐標等
四方向計算和八方向計算:
在這里插入圖片描述
5.相似運算
按照某種相似性度量來搜索給定物體相似的其他物體的運算

(2.2)多層柵格數據的疊置分析

概述:多層柵格數據經過一系列的處理得到的新的柵格的屬性的過程

(2.2.1)單點變換

概念:只對相應的柵格單元的屬性作某種運算得到的新圖層屬性不受鄰近值得影響

(2.2.2)區域變換

概念:新屬性不僅與原來得屬性有關,還與原屬性所在得長度、區域、面積有關

3.柵格疊置的作用

(1)類型疊置:獲取到新的類型;
(2)數量統計:計算某區域的類型和面積
(3)動態分析:同區、同屬性、不同時間的疊置
(4)益本分析:計算成本、價值
(5)幾何提取:范圍內的信息的提取

第五節、空間數據的緩沖區分析

1.什么是緩沖區?

是地理空間目標的一種影響范圍或服務范圍;

2.什么是空間緩沖區分析?

根據分析對象的點線面目標、自動在其周圍建立一定距離的帶狀多邊形,從而識別這些對象對臨近對象的輻射范圍或者影響程度,以便於為某項分析或者決策提供依據

3.緩沖區分析的三種模型

三種模型分析都是距離與影響程度的分析
在這里插入圖片描述

4.基於矢量數據的緩沖區的建立

以線狀地物為例:
1.線的重采樣:對線進行化簡,加快緩沖區的建立

2.建立線的緩沖區:在線的兩端按照一定的距離繪制平行線,在線的端點處繪制半圓,連接成緩沖區多邊形

3.重疊處理:對緩沖區邊界求交,並判斷每個交點是出點還是入點,以決定交點之間的線段保留或刪除。這樣就可得到島狀的緩沖區

第六節、泰森多邊形分析

泰森多邊形的特性:

每一個泰森多邊形中只有一個離散點;
泰森多邊形內的點到相應離散點的距離最近;
位於泰森多邊形邊上的點到其兩邊的離散點的距離相等;

泰森多邊形的建立步驟

1.構建三角網,構件Delaunay三角網
2.找出與每個離散點相鄰的所有三角形;
3.將於離散點相鄰的三角形按照順時針或逆時針的方向排序;
4.計算每個外接圓的圓心;
5.根據每個點的相鄰三角形,連接三角形的外心,形成泰森多邊形,對於三角網邊緣的泰森多邊形,作出其中垂線於輪廓的相交的部分;

補充內容:

1.使用線性內插計算格網或三角網的高程

在這里插入圖片描述

2.學生數據庫的E-R模型

在這里插入圖片描述
在這里插入圖片描述


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM