UTF-8是UNICODE的一種變長字符編碼又稱萬國碼,由Ken Thompson於1992年創建。現在已經標准化為RFC 3629。UTF-8用1到6個字節編碼UNICODE字符。用在網頁上可以同一頁面顯示中文簡體繁體及其它語言(如日文,韓文)。
UTF-8編碼可以通過屏蔽位和移位操作快速讀寫。字符串比較時strcmp()和wcscmp()的返回結果相同,因此使排序變得更加容易。字節FF和FE在UTF-8編碼中永遠不會出現,因此他們可以用來表明UTF-16或UTF-32文本(見BOM) UTF-8 是字節順序無關的。它的字節順序在所有系統中都是一樣的,因此它實際上並不需要BOM。
說了這么多UTF-8的好處,現在言歸正傳,說說一個將txt文件轉換成UTF-8格式超簡單的方法。
首先,我們打開一個txt文件,如下圖:
然后,在上部的菜單欄中,我們選擇 ”文件“ ---> "另存為"
在彈出的新窗口中,設置新文件的保存位置,並且將對話框下方的”編碼“ 選擇為”UTF-8“, 最后點擊
保存按鈕,就生成了一個UTF-8格式的TXT文件了。