解決ubuntu文件亂碼問題


文章轉載http://yunwei.info/?paged=2

 

按下 Alt-F2,是打開“運行應用程序”

打開vim的配置文件,位置在/etc/vim/vimrc

在其中加入

set fileencodings=utf-8,gb2312,gbk,gb18030
set termencoding=utf-8
set encoding=prc

保存退出,此時vim就能正確顯示中文了。

對於gedit,解決方法如下:

在終端中運行 gconf-editor

在打開的界面中選擇: apps->gedit-2->preferences->encodings

在右邊的auto_detected和shown_in_menu上點右鍵編輯,點add,分別加入GB2312,並點UP按鈕移動到第一位。關閉,就可以在gedit中顯示中文了。
使ubuntu正常顯示GB2312、GBK編碼文件
ubuntu環境設置的字符集utf8,windows默認字符集是GBK,Ubuntu的默認字符集為utf-8,這使 得在用telnet登錄遠程服務器或查看windows文件時出現亂碼。需要將ubuntu環境設置為GBK或GB2312,或設置軟件使其正確顯示漢 字。下面以GBK字符集為例進行說明:

一、修改Ubuntu默認字符集為GBK
1、首先設置sudo vi /var/lib/locales/supported.d/local
添加一行 zh_CN.GBK GBK
sudo locale-gen生成locale

2、修改ubuntu的字符集
方法一: 修改用戶目錄下的.profile文件,增加以下內容:
LANGUAGE=”zh_CN:zh:en_US:en”
LANG=zh_CN.GBK
重新登錄即可。
這個方法只對該用戶有效。
方法二:修改/etc/environment,增加以下內容:
LANGUAGE=”zh_CN:zh:en_US:en”
LANG=zh_CN.GBK
然后重啟X即可
這個方法對沒有設置LANG及LANGUAGE環境變量的用戶有效

二、設置軟件命名其正常顯示GBK
這需要軟件本身支持多字符編碼,最常見的是IE等瀏覽器,可以通過設置編碼顯示GBK字符集。Ubuntu下的一些軟件也支持此功能,以ubuntu的終 端程序為例,使其正常顯示GBK編碼的方法是:在termial窗口上點擊菜單:終端->設置字符編碼->選擇GBK即可。

##########################################
解決文件名,mp3標簽,文本文件的中文亂碼

轉換文件名由GBK為UTF8

sudo apt-get install convmv
convmv -r -f cp936 -t utf8 –notest –nosmart *
轉換文件內容由GBK到UTF8

iconv -f gbk -t utf8 $i > newfile

轉換 mp3 標簽編碼

sudo apt-get install python-mutagen
find . -iname “*.mp3” -execdir mid3iconv -e GBK {} /;

#####################################
buntu默認的打開.txt文件用的是gedit,可gedit默認編碼是UTF8,打開windows下編輯的gb2312的文檔都是亂碼。解決方法之一就是把gedit的編碼改為GB2312,方法如下:

在Applications菜單上點右鍵,選擇EditMenu.在MainMenu的對話框中勾選SystemTools-ConfigurationEditor,並從Applications菜單中開啟。

依次開啟/apps/gedit-2/preferences/encodings/雙擊右側auto_detected,在彈出對話框中點選Add,添加Values值為GB2312,確定后選中,點選Up按鈕將其移至第一位。

同樣方法,對show_in_menu進行設置,並將GB2312置於首位。

還有一種方法是用openoffice打開.txt文件時,會讓你選擇編碼,選GB2312就行了。

***********************************************

1.系統默認編碼
將系統的默認編碼設置為 GBK, 這樣和 Windows 下面的開發環境最接近. 設置的方法應該不止一種, 我采用的是編輯 /etc/environment, 改成這個樣子:
LANGUAGE=”zh_CN:zh:en_US:en”
GST_ID3_TAG_ENCODING=GBK
LANG=zh_CN.GBK
LC_CTYLE=zh_CN.GBK

**********************************************
Ubuntu 中文編碼設置

Ubuntu 默認采用UTF8編碼,可以方便global。但對中文支持,還不細致,即便默認采用中文安裝,也並不會自動添加GB*等支持,致使在Ubuntu下訪問部分Win文本文件時,出現亂碼。

I. 配置系統環境
執行 sudo vi /var/lib/locales/supported.d/zh
加入以下配置參數

zh_CN.GB18030 GB18030 (最新漢字編碼字符集,向下兼容GBK,GB2312)
zh_CN.GBK GBK (漢字擴展編碼,向下兼容GB2312, 並包含BIG5全部漢字)
zh_CN.GB2312 GB2312 (簡化漢字編碼字符集, 最近有客戶要我們改進GB2312,太看得起我們了,我只能說:”NO!”)
zh_CN.GB18031 GB18031 (數字鍵盤漢字編碼輸入,面向手持設備,我的Nokia3120從來就是發短信,接聽電話,無法和PC通訊,就不用這個了。 maybe用Google Android SDK的大俠們需要這個)
zh_HK.BIG5 BIG5 (繁體)
zh_TW.BIG5 BIG5 (繁體)

然后執行 sudo locale-gen
提示以下信息,成功了
zh_CN.GB18030… done
zh_CN.GBK… done
……

II. 系統環境支持GB*內碼了,但用vi, gedit等工具訪問文件還會繼續亂碼,需要針對不同的工具分別配置,使之自己檢測支持范圍內的編碼
e.g. vi
執行 sudo vi /etc/vim/vimrc
加入以下配置參數
let &termencoding=&encoding
set fileencodings=utf-8,gb18030,gbk,gb2312,big5

e.g. gedit
執行 sudo gconf-editor
選擇 apps/gedit-2/preferences/encodings
找到 auto_detected 編輯,在Values中分別加入 GB18030,GBK,GB2312,BIG5


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM