泰文排版規則


轉自: 泰文排版規則

 百度文檔:http://wenku.baidu.com/view/19574a03de80d4d8d15a4f0c.html###

unicode 泰文對應編碼規則:http://www.unicode.org/charts/PDF/U0E00.pdf

1.字母編碼

這里只介紹泰文的Unicode編碼。Unicode編碼為雙字節,前面為高字節,后面為低字節,這里都用十六進制表示。如0E00表示一個空格,0E為高字節,00為低字節。
泰文編碼和字母的對照關系如下:

編碼段: 0E00-0E16,0E17-0E2D,0E2E-0E30
泰文字符:กขฃคฅฆงจฉชซฌญฎฏฐฑฒณดตถทธนบปผฝพฟภมยรฤลฦวศษสหฬอฮฯะ
編碼段: 0E31-0E3A
泰文字符: 

  ัา ำ ี ึ ื ุ ู ฺ
編碼段: 0E3F-0E46
泰文字符:฿ เ แ โ ใ ไ ๅ ๆ
編碼段: 0E47-0E4E
泰文字符:   ็ ่ ้ ๊ ๋ ์ํ ๎
編碼段: 0E4F-0E5B
泰文字符:๏๐๑๒๓๔๕๖๗๘๙๚๛

2.拼寫規則
泰語是一種拼音文字。有元音,輔音和聲調。

a)元音
元音有單元音和復元音之分,復元音是由兩個或三個單元音組成的。單元音可以位於輔音的上下左右各側。(說明:下面的杠“-”表示輔音的位置。)


規則①:在輔音右邊的單元音
字符: -า -ะ -อ
例子: กา จะ ดอ

規則②:在輔音左邊的單元音
字符: เ- แ- โ- เ-าะ เ-ะ แ-ะ โ-ะ เ-อ แ-อ
例子:เก แจ โอ แตะ โดะ

規則③:在輔音上邊的單元音
字符: -ิ -ี -ึ -ื
例子: ดีษืฉึ

規則④:在輔音下邊的單元音
字符: -ุ -ู
例子: กุมู

規則⑤:復元音
字符: เ-ีย เ-ือ -ัว -าย -ัย ไ- ใ- -ุย โ-ย -อย เ-ย -าว เ-า -ิว เ-ว แ-วเ-ียว เ-ือย -วย
例子: เปีย ได๊ แจ๋ว เดือย

b)輔音
單輔音有中輔音,高輔音,低輔音,塞音,擦音等之分。它們與長元音和短元音相拼時,能夠影響或決定聲調。復輔音是由多個單輔音組成的。

單輔音:กจดตฎฏบปอขคฆฉชฌผพภฝฟถฐทธฑฒสศษซหฮงนมยญวรลฬ

規則①:有輔音字母อ 字母和元音字母อ 外形相同,只能靠其位置進行區分。
例子: ออ

規則②:有輔音字符ปฝฟ,上面加元音或聲調時,元音或聲調字符要略微向左移一些。
例子:ปิป๊ฟีฝื่

c)聲調
泰文中有5個聲調,只有第一聲不用標出來。
聲調:    

規則①:聲調加在輔音的右上方。
例子:ก่า

規則②:輔音上有元音,再加聲調符號時,聲調符號要加在元音上。
例子:อื่ทึ๊

d)尾音
尾音: -ง -น -ม -ำ -ก -ด -บ

規則①:元音字母-ะ 后有尾音時。要把-ะ寫成-ั,放在輔音和尾音之間的上方。
例子: 如กะง 要寫成กัง

規則②:元音字母เ-ะ 和แ-ะ 后有尾音時,把-ะ 寫成-็,放在輔音和尾音之間的上方。
例子: 如เตะม 寫成เต็ม

規則③:元音字母โ-ะ 后有尾音時,โ-ะ省略不寫成。
例子: 如โตะม 寫成ตม

規則④:復元音-ัว 后有尾音時,要將去-ั掉。
例子: 如จัวน 寫成จวน

規則⑤: -ำ 和-ัม 讀音相同,詞義不同。
例子: 如จกำ和กัม

e)數字
泰文有自己的數字符(0-9)。
數字字符:๐๑๒๓๔๕๖๗๘๙

f)其他
其他符號ฤฦๅ ์(不發音符號)ๆ(重復符號)ฯ(簡略符號)

3.處理方式
根據上述的拼寫規則,可以把所有字符形象的分為如下幾類:
1.鞋子字符。它可以疊加在主體字符的下面,就像給主體字符穿的鞋子一樣。
2.主體字符。它上面可以疊加帽子字符,下面可以疊加鞋子字符,就像給它帶上帽子,穿上鞋子一樣。
3.帽子字符。它可以疊加在主體字符的下面,就像給主體字符帶上帽子一樣。
4.聲調字符。它是一個詞語的聲調,必須疊放在主體字符或帽子字符上面。
5.獨立字符。它是不可以穿鞋子,不可以帶帽子,也不可以加聲調的一類字符。
6.標點符號。它是用來斷句的標點符號,和其他語言中的標點符號的功能一樣。
下面是類型,編碼,字符之間的對照關系。
a)鞋子
編碼段:0E38-0E39
字符:   ุ ู

b)主體
編碼段:0E01-0E10,0E11-0E1F,0E20-0E2E,0E32
字符:กขฃคฅฆงจฉชซฌญฎฏฐฑฒณดตถทธนบปผฝพฟภมยรฤลฦวศษสหฬอฮ า

c)帽子
編碼段:0E31, 0E47,0E33-0E37,0E4C-0E4E
字符:   ั ็ ำ ิ ี ึ ื์ ํ ๎

d)聲調
編碼段:0E48-0E4B
字符:    

e)獨立
編碼段:0E2F,0E30,0E3A,0E40-0E46,0E5A-0E5B
字符: ฯะ ฺ เ แ โ ใ ไ ๅ ๆ๚๛

f)標點
編碼段:0E00,0E3F,0E4F-0E59
字符: ฿ ๏๐๑๒๓๔๕๖๗๘๙

g)其他
編碼段:0E3B-0E3E,0E5B-0E7F

補充說明:
1.如果用①②③④⑤⑥分別表示鞋子字符,主體字符,帽子字符,聲調字符,獨立字符和標點符號。
則可能出現的組合情況有:①②,①②③,①②④,①②③④,②③,②④,②③④,⑤和⑥。

2.①和③之間沒有②的時候,③需要往下移動一點。

3.②的編碼是0E1B,0E1D,0E1F時,③或④或③④,最好向左移動一點。

4.②的編碼是0E0D或0E10,而①的編碼是0E38 或0E39時,②的下部不畫,用①來代替。
轉自: 山不在高,有金則名。
非常感謝 高金山先生的無私奉獻! 
============================================================================
 
大家看了這份文檔后,是否覺得有些復雜?
給大家一個肯定的答案,要實現泰文其實是非常簡單的,就看你的字庫格式是怎樣的?
 
為了應對這種特殊情況(泰文),請按以下方法處理:
記錄一個字符的有效顯示數據(像素)的基本信息,如:寬,高,左右偏移,上下偏移(有基線的概念)等。
例如: "รี่",它分別由如下三個字符(內碼)組成。
 
STARTCHAR 00C3  // 'ร'
ENCODING 195
DWIDTH 12 0     //字寬為12像素(含字間距)
BBX 9 13 1 0    //有效像素寬度為9,高度為13. (正數)向右偏移1個像素開始顯示。
BITMAP
3F80
7F80
C000
FE00
FF00
8380
0180
0180
0180
0780
0980
0980
0700
ENDCHAR
 
STARTCHAR 00D5  // 'ี'
ENCODING 213
DWIDTH 0 0       // 字寬為0 
BBX 9 5 -12 15    //有效像素寬度為9,高度為5,(負數)向左偏移12個像素,(正數)向上偏移15個像素
BITMAP
0080
3C80
4380
8180
FF80
ENDCHAR
 
STARTCHAR 00E8  // '่'
ENCODING 232
DWIDTH 0 0
BBX 1 4 -4 21  //有效像素寬度為1,高度為4,(負數)向左偏移4個像素,(正數)向上偏移21個像素
BITMAP
80
80
80
80
ENDCHAR
圖文詳解:


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM