GIS概念中有相當多的數據文件格式,我們經常接觸到的數據格式可以大致分為“柵格數據”與“矢量數據”這兩類。這兩類數據分別對應着不同的應用場景,我們通常使用“柵格數據”來當作底圖,示意地理構造物(如山地、河流、湖泊、建築物、道路等)的空間形態(如形狀、位置、大小等),並可以進行一些簡易的空間分析;使用“矢量數據”來參與業務邏輯的實現與分析,進行復雜的空間分析。
把這兩種數據格式放在一起,分別從數據結構、編碼方法、獲取途徑、優缺點這幾個方做對比,來系統說一下矢量數據和柵格數據。
數據結構
柵格數據:
將空間分割成有規律的網格,每一個網格稱為一個單元,並在各單元上賦予相應的屬性值來表示實體的一種數據形式。以規則的陣列來表示空間地物或現象分布的數據組織,組織中的每個數據表示地物或現象的非幾何屬性特征。
柵格結構的顯著特點:屬性明顯,定位隱含。
矢量數據:
矢量數據結構是對矢量數據模型進行數據的組織。通過記錄實體坐標及其關系,盡可能精確地表現點、線、多邊形等地理實體,坐標空間設為連續,允許任意位置、長度和面積的精確定義。矢量數據結構直接以幾何空間坐標為基礎,記錄取樣點坐標。
矢量結構的顯著特點:定位明顯,屬性隱含。
編碼方法
柵格數據:
1. 直接柵格編碼,就是將柵格數據看作一個數據矩陣,逐行(或逐列)逐個記錄代碼;
2. 壓縮編碼,包括鏈碼(弗里曼鏈碼)比較適合存儲圖形數據;
3. 游程長度編碼通過記錄行或列上相鄰若干屬性相同點的代碼來實現;
4. 塊式編碼是有成長度編碼擴展到二維的情況,采用方形區域為記錄單元;
5. 四叉樹編碼是最有效的柵格數據壓縮編碼方法之一,還能提高圖形操作效率,具有可變的分辨率。
6. 八叉樹與十六叉樹編碼
前面的數據結構都是基於二維的,在相當多的情況下,如地下資源埋藏、地下溶洞的空間分布,二維的坐標體系根本無法表達。因此需要有三維數據結構,如果考慮空間目標隨時間變化,那還需要4維數據結構。較好的表達三維與四維結構是在四叉樹基礎上發展起來的八叉樹(三維)和十六叉樹(四維)。
矢量數據:
1. 實體數據結構,對於點實體和線實體,直接記錄空間信息和屬性信息;
2. 坐標序列法是由多邊形邊界的x,y坐標對集合及說明信息組成,是最簡單的一種多邊形矢量編碼法,文件結構簡單,但多邊形邊界被存儲兩次產生數據冗余,而且缺少鄰域信息;
3. 樹狀索引編碼法是將所有邊界點進行數字化,順序存儲坐標對,由點索引與邊界線號相聯系,以線索引與各多邊形相聯系,形成樹狀索引結構,消除了相鄰多邊形邊界數據冗余問題;
4. 拓撲結構編碼法是通過建立一個完整的拓撲關系結構,徹底解決鄰域和島狀信息處理問題的方法,但增加了算法的復雜性和數據庫的大小。
獲取途徑
柵格數據:
1. 柵格法:在待輸入的圖形上均勻划分柵格單元,逐個柵格地決定其屬性代碼,最后形成柵格數字地圖文件。這是人工編碼,當數據量太大時,該法費工費時,工作量相當大。
2. 轉換法:用手扶跟蹤數字化或自動跟蹤數字化得到矢量結構數據,再轉換為柵格結構。柵格數據
由矢量數據向柵格數據轉換是理想的方法。
3. 掃描數字化:逐點掃描待輸入的專題地圖,對掃描數據重新采樣與再編碼,從而得到柵格數據文件。
4. 分類影像輸入:將經過分類解譯的遙感影像數據直接或重新采樣后輸入系統,這是高效獲取數據的方法。
矢量數據:
1. 現有地圖轉化為矢量,如通過掃描儀把現有紙質地圖數字化,再使用繪圖設備(手扶跟蹤)或者繪圖軟件(屏幕跟蹤)轉化為矢量數據;
2. 實測數據,如數字測圖。野外實地測量等獲取的數據轉換后可以直接進入GIS的地理數據庫;
3. 遙感數據,遙感數據通校正、配准等一系列操作,使用手動矢量化或者自動矢量化的方式將遙感數據轉化為矢量數據;
4. 其他格式數據轉換為矢量數據,如文字材料、統計數據、記錄表格等;
5.空間分析,空間疊加、緩沖分析等產生新的矢量數據;
優缺點
柵格數據:
優點
1. 屬性明顯,定位隱含,即數據直接記錄屬性的指針或數據本身,而所在位置則根據行列號轉換為相應的坐標;
2. 數據結構更加簡單,即由像元組成矩陣結構,其中的像元值表示坐標,有時與屬性表相關聯;
3. 可以表示連續表面以及執行表面分析,現勢性較強;
4. 點、線、面和表面都可同樣存儲;
5. 對復雜數據集也可執行快速疊置;
6. 有利於遙感數據的匹配應用和分析;
7. 格式更加強大,高級的空間和統計分析較容易實現;
缺點
1. 由於柵格數據集的像元尺寸具有局限性,所以可能會帶來空間誤差;
2. 柵格數據集可能會非常大,冗余度較高,需要壓縮處理。雖然分辨率會隨着柵格像元大小的減小而提高,但這會占用更多的磁盤空間,而且會拖慢處理速度。對於給定區域,將柵格像元大小更改為現有大小的一半時,所需的存儲空間會增大為原來的四倍,具體情況取決於所使用的數據類型和存儲技術;
3. 將數據重建到固定間距的柵格像元邊界時也會損失一定的精度;
定位精度比矢量低,拓撲關系難以表達;
矢量數據:
優點
1. 定位明顯,屬性隱含,通過記錄坐標的方式盡可能精確地表示點、線和多邊形等地理實體,坐標空間設為連續,允許任意位置、長度和面積的精確定義;
2. 通過記錄實體坐標及其關系,盡可能精確地表示點、線、多邊形等地理實體,放大不失真,可以任意放大或縮小圖形而不會影響出圖的清晰度;
3. 具有精度高、存儲空間小等特點,是一種高效的圖形數據結構;
4. 允許任意位置、長度和面積的精確定義;
5. 利於網絡、檢索分析,提供有效的拓撲編碼,對需要拓撲信息的操作更有效;
缺點
1. 存儲方式造成相鄰多邊形的公共邊界被數字化並存儲兩次,出現數據冗余和細碎多邊形,導致數據不一致;點位字典存儲可保證公共邊的唯一性;
2. 自成體系,缺少多邊形的鄰接信息,鄰域處理復雜,需追蹤出公共邊;
3. 處理島或洞等嵌套問題較麻煩,需要計算多邊形的包含等;
4. 數據結構復雜,各自定義,不便於數據標准化和規范化,數據交換困難;
5. 多邊形疊置分析困難,沒有柵格有效,表達空間變化性能力差;
6. 不能像數字圖像那樣做增強處理,數學模擬比較困難;
7. 軟硬件技術要求高,顯示與繪圖成本較高;
————————————————
原文鏈接:https://blog.csdn.net/gis0911178/java/article/details/88636466