博客背景和目的
最近在用C++寫一個底層的東西,需要讀取和創建shp文件。雖然接觸shp文件已經幾年了,但是對於shp文件內到底包含什么東西一直是一知半解。以前使用shp文件都是利用軟件(如ArcGIS)直接打開,保存;創建文件則需要專門利用ArcToolBox等創建圖形。
網上有現成的有關shp文件的庫,如GDAL等,可以結合這些庫來讀寫shp文件。但是由於編程環境問題、庫的版本、編譯、引用等等問題,在現有情況下無法正常使用,加之使用現有的庫不能讓我從底層完全了解shp文件的組織方式,遂決心一點點地自己動手寫讀和寫(創建)的方法。
在嘗試解決這個問題的時候,我瀏覽了網上眾多有關shp文件讀寫的博客和資料,發現大多博客對於shp文件的情況和讀取過程有詳細的記錄,但是幾乎沒有寫(創建)底層shp文件的代碼示例。雖然“寫”與“讀”類似,但是其中還是有很多“陷阱”。為了記錄自己的探索歷程,同時給后面的人提供經驗和參考,故寫此博客,希望能給讀者提供幫助。
shp文件基本情況
shp是shapefile的縮寫,關於shapefile的歷史和特點我不過多敘述,網上隨便一搜都有詳細內容,我着重敘述幾點:
- 一個完整的shapefile文件至少包含shp文件、dbf文件和shx文件,它們都是同名的,文件的后綴格式是.shp、.dbf和.shx。也就是說,缺少其中任何一項,都無法直接用ArcGIS打開。
- shp文件主要包含圖形坐標數據,由文件頭和實體信息組成。
- dbf文件主要記錄要素的屬性信息,實際上是一個表,在ArcGIS中打開后實際上就是屬性表。
- shx文件是索引文件,記錄主文件(shp文件)中每條記錄距離主文件開始位置的偏移量和每條記錄的長度。
- shp的讀寫意味着shp、dbf和shx的讀寫,利用C++程序讀的過程中如果只是需要圖形和屬性,shx不是必需的;但是寫的時候為了使輸出的shp能被廣泛使用,必須要寫(創建)shx文件。
- shp等三個文件都是二進制文件,變量有big和little區分,還涉及16進制和10進制的轉換。
編程環境
C++ 、VS2010、MFC
其他工具
推薦一個檢查shp、shx和dbf文件的神器——shapechk.exe,這個工具可以檢查shp文件是否有問題、能檢查和生成shx和dbf,資源見下方。
閱讀資料
《shape白皮書.pdf》英文版shapefile說明的翻譯版
《shp文件詳細格式.doc》 詳細解讀shp格式,並且有讀取文件的源碼
鏈接:https://pan.baidu.com/s/1YLwqTFfqLYguQntk7PrpGw
提取碼: cshy
雖然有以上參考資料,但是實際編程中仍會有許多問題,眾多問題將在后面一一敘述。