接手一個韓國的項目,需要在arcmap中配置一個韓國地圖並發布到arcserver中進行切圖,給的韓國地圖的shapefile文件中屬性字段都是韓文的,在中文的系統中,arcMap中顯示的韓文都是亂碼,因此添加標注時,都是一系列的亂碼。
原因分析:中文系統一般采用GBK的編碼方式,因此中文系統下,生成的shapefile文件都是以GBK來編碼其中的字段屬性的。而項目中的shapefile文件都是韓國朋友直接發送過來的,在韓文系統下,他們用的UTF-8方式來編碼其中的韓文屬性,因此在我的中文系統電腦上,arcmap用默認GBK方式來打開UTF-8編碼的韓文,就會出現亂碼。
解決辦法:
在 ArcGIS Desktop (ArcMap, ArcCatalog, and ArcToolbox) 中,有編碼頁轉換功能(CODE PAGE CONVERSION),可以讀寫多種字符編碼的 shapefile 和 dBASE 表。在系統注冊表中,編碼頁轉換功能(CODE PAGE CONVERSION)命名為 'dbfDefault',可以修改這個值。在 shapefile (.DBF) 的頭文件中包含了引用的編碼頁,用來與用戶的區域設置一致。例如,如果用戶使用了日本的區域設置,那編碼頁是'Shft-JIS'。
在 ArcGIS 10.2.1 版本,shapefile (.DBF) 的編碼頁的默認設置為 UTF-8 (UNICODE) 。
在 ArcGIS 10.2.1 之前,可以通過下面的方法來設置編碼行為:
1. 開始--運行,輸入”Regedit“,打開注冊表。
2. 如是用的是 10.x 版本 ArcGIS Desktop,定位到” My Computer\HKEY_CURRENT_USER\Software\ESRI\Desktop 10.x' (如果是9.3.1之前的版本,定位到 'My Computer\HKEY_CURRENT_USER\Software\ESRI')。
3. 創建項 'Common',接着創建 'CodePage'項,添加 ‘字符串’,名稱: dbfDefault,健值:oem(或者UTF-8,我的都設置成UTF-8)。
如下為支持的編碼值:
OEM Code Page Values:
OEM, 437, 708, 720, 737, 775, 850, 852, 855, 857, 860, 861, 862, 863, 864, 865, 866, 869, 932, 936, 950
ANSI Code Page Values:
ANSI, 1250, 1251, 1252, 1253, 1254, 1255, 1256, 1257, 1258, Big5, SJIS
ISO Code Page Values:
ISO, 88591, 88592, 88593, 88594, 88595, 88596, 88597, 88598, 88599, 885910, 885913, 885915, EUC
Unicode Values:
UTF-8
備注:
1)我裝的是arcgis9.3,為了保險起見,修改'dbfDefault'時,我找到了注冊表中所有的ESRI項值,然后都進行了步驟3.
2)需要注意的是'dbfDefault' 這項設置僅對 ArcGIS Desktop 生效,對於一些很老版本的ArcGIS 產品不適用;僅對 shapefile 生效,Personal GDB等不生效。
3)'dbfDefault' 的作用
使用 ArcGIS for Desktop 打開 dBase 表文件時,程序先去讀頭文件中的 Language Driver ID (LDID) 或者是同名 *.CPG文件。前面二者都是用來在讀文件之前,決定用什么編碼類型來正確讀出文件。如果有必要, ArcGIS for Desktop 會進行編碼轉換來顯示字符串。
如果文件缺失 LDID 或者 .CPG 文件,編碼就會被假定為 Windows (ANSI/Multi-byte)。也是因為這個原因,如果文件是 OEM 編碼的,並且沒有寫入 LDID 或者 .CPG,字符就會出現亂碼。 也就說 ArcGIS 把 OEM 文件當成 ANSI 文件來處理了。
多數情況下, shapefiles 和 dBASE 文件都會存儲編碼頁信息。 但是有些程序的OEM文件沒有包含編碼頁信息,例如 Microsoft Access 2000 and Excel 2000,所以這些文件讀取時,就會亂碼。為了避免這個問題,用戶可以給沒有編碼頁信息的文件設置dbfDefault 。
寫: 在注冊表中設置 'dbfDefault' ,可以決定導出的 shapefile 和 dBASE 的編碼類型。例如,把 'dbfDefault' 設置為 OEM ,那么用 ArcMap, ArcCatalog, ArcToolbox 生成出來的 shapefile 和 dBASE 文件就是以 OEM編碼的,設置成 ANSI ,那 shapefile 和 dBASE 文件就是 ANSI 編碼的。
讀: 讀 shapefile 和 dBASE 文件的邏輯與寫是相同的,如果缺失編碼信息,ArcGIS 讀取文件的編碼類型由 dbfDefault 決定。
相關技術文章:http://support.esri.com/en/knowledgebase/techarticles/detail/21106
本文轉載自http://blog.csdn.net/kikitamoon/article/details/19116415