如題,可用於PCtoLCD生成字庫等操作。
[密碼ab31](https://qsbye.lanzoui.com/i5l7Wsk0hrc "密碼ab31")
附錄:
GBK編碼范圍:8140-FEFE,漢字編碼范圍見第二節:碼位分配及順序。
GBK編碼,是對GB2312編碼的擴展,因此完全兼容GB2312-80標准。GBK編碼依然采用雙字節編碼方案,其編碼范圍:8140-FEFE,剔除xx7F碼位,共23940個碼位。共收錄漢字和圖形符號21886個,其中漢字(包括部首和構件)21003個,圖形符號883個。GBK編碼支持國際標准ISO/IEC10646-1和國家標准GB13000-1中的全部中日韓漢字,並包含了BIG5編碼中的所有漢字。GBK編碼方案於1995年12月15日正式發布,這一版的GBK規范為1.0版。
一、字匯
GBK 規范收錄了 ISO 10646.1 中的全部 CJK 漢字和符號,並有所補充。具體包括:
- GB 2312 中的全部漢字、非漢字符號。
- GB 13000.1 中的其他 CJK 漢字。以上合計 20902 個 GB 化漢字。
- 《簡化字總表》中未收入 GB 13000.1 的 52 個漢字。
- 《康熙字典》及《辭海》中未收入 GB 13000.1 的 28 個部首及重要構件。
- 13 個漢字結構符。
- BIG-5 中未被 GB 2312 收入、但存在於 GB 13000.1 中的 139 個圖形符號。
- GB 12345 增補的 6 個拼音符號。
- 漢字“〇”。
- GB 12345 增補的 19 個豎排標點符號(GB 12345 較 GB 2312 增補豎排標點符號 29 個,其中 10 個未被 GB 13000.1 收入,故 GBK 亦不收)。
- 從 GB 13000.1 的 CJK 兼容區挑選出的 21 個漢字。
- GB 13000.1 收入的 31 個 IBM OS/2 專用符號。
12.未錄入《新華字典》上的一些字,如“韡”的簡體。
二、碼位分配及順序
GBK 亦采用雙字節表示,總體編碼范圍為 8140-FEFE,首字節在 81-FE 之間,尾字節在 40-FE 之間,剔除 xx7F 一條線。總計 23940 個碼位,共收入 21886 個漢字和圖形符號,其中漢字(包括部首和構件)21003 個,圖形符號 883 個。
全部編碼分為三大部分:
-
漢字區。包括:
a. GB 2312 漢字區。即 GBK/2: B0A1-F7FE。收錄 GB 2312 漢字 6763 個,按原順序排列。
b. GB 13000.1 擴充漢字區。包括:
(1) GBK/3: 8140-A0FE。收錄 GB 13000.1 中的 CJK 漢字 6080 個。
(2) GBK/4: AA40-FEA0。收錄 CJK 漢字和增補的漢字 8160 個。CJK 漢字在前,按 UCS 代碼大小排列;增補的漢字(包括部首和構件)在后,按《康熙字典》的頁碼/字位排列。
(3) 漢字“〇”安排在圖形符號區GBK/5:A996。 -
圖形符號區。包括:
a. GB 2312 非漢字符號區。即 GBK/1: A1A1-A9FE。其中除 GB 2312 的符號外,還有 10 個小寫羅馬數字和 GB 12345 增補的符號。計符號 717 個。
b. GB 13000.1 擴充非漢字區。即 GBK/5: A840-A9A0。BIG-5 非漢字符號、結構符和“〇”排列在此區。計符號 166 個。 -
用戶自定義區:分為(1)(2)(3)三個小區。
(1) AAA1-AFFE,碼位 564 個。
(2) F8A1-FEFE,碼位 658 個。
(3) A140-A7A0,碼位 672 個。
第(3)區盡管對用戶開放,但限制使用,因為不排除未來在此區域增補新字符的可能性。
三、字形
GBK 對字形作了如下的規定:
- 原則上與 GB 13000.1 G列(即源自中國大陸法定標准的漢字)下的字形/筆形保持一致。
- 在 CJK 漢字認同規則的總框架內,對所有的 GBK 編碼漢字實施“無重碼正形”(“GB 化”);即在不造成重碼的前提下,盡量采用中國新字形。
- 對於超出 CJK 漢字認同規則的、或認同規則尚未明確規定的漢字,在 GBK 碼位上暫安放舊字形。這樣,在許多情況下 GBK 收入了同一漢字的新舊兩種字形。
- 非漢字符號的字形,凡 GB 2312 已經包括的,與 GB 2312 保持一致;超出 GB 2312 的部分,與 GB 13000.1 保持一致。
- 帶聲調的拼音字母取半角形式。5. 帶聲調的拼音字母取半角形式。