歡迎和大家交流技術相關問題:
郵箱: jiangxinnju@163.com
博客園地址: http://www.cnblogs.com/jiangxinnju
GitHub地址: https://github.com/jiangxincode
知乎地址: https://www.zhihu.com/people/jiangxinnju
linux系統中文件名內容為urf8編碼, windows系統中文件名默認為gbk編碼, 多數文檔使用gbk編碼,系統采用utf8編碼
無中文輸入法導致的亂碼
1、ibus輸入法
Ubuntu 系統安裝后已經自帶了ibus輸入法,在英語環境下默認不啟動。配置ibus自動啟動可以在ubuntu系統菜單上選擇System --- Preferences --- Startup Applications,在該窗口中增加一個程序:
Name: ibus-daemon
Command: ibus-daemon -d -x -r
ibus默認提供的中文輸入法比較弱智,需要額外安裝ibus-pinyin,命令如下:
sudo apt-get install ibus-pinyin
這時,還需要將ibus-pinyin輸入法啟動。在ubuntu系統菜單上選擇System --- Preferences --- IBus Preferences,在Input Method頁中的“Select an input method”下拉框中選擇增加Chinese – Pinyin,就是圖標中有個一個大大的“拼”字的那一個,然后點擊Add按鈕,最后通過Up按鈕將該輸入法移動到最上面。系統重啟后,通過Ctrl + 空格即可調出ibus輸入法。ibus輸入法總體來說不錯,但是在我的環境下發現無法在部分Java程序中調出來,例如Netbeans、OpenProj。
2、fcitx輸入法
由於ibus的缺陷,所以我嘗試了fcitx,使用下來也非常不錯,而且可以在Java程序中正常使用,只是在這種情況下光標跟隨有些問題,輸入界面會停 留在屏幕最下端,但是可以接受,比起ibus不能使用要好多了。
安裝fcitx:
sudo apt-get install fcitx
啟動fcitx:
im-switch -s fcitx
注銷后重新登錄,fcitx就會生效。如果需要切換回ibus,可以運行im-switch -s ibus,然后注銷,重新登錄。fcitx同樣可以通過Ctrl + 空格調出,這時會發現fcitx顯示的中文是方框,因此需要修改fcitx的配置。Fcitx的配置文件在~/.fcitx/config,該文件為 GBK編碼,在Ubuntu下顯示不正常,可以通過如下方式操作:
cd ~/.fcitx
iconv -f gbk -t utf8 config > config.tmp
編輯config.tmp文件:
顯示字體(中)=WenQuanYi Micro Hei
顯示字體大小=10
使用粗體=0
保存退出,然后運行命令:
iconv -f utf8 -t gbk config.tmp > config
注銷后重新登錄,fcitx顯示正常。
對於搜狗輸入候選字亂碼問題,先運行
sudo apt-get install fcitx-module-kimpanel
然后注銷或者重啟,一般就可以了
utf8 和 UTF-8 有什么區別
“UTF-8”是標准寫法,在windows下邊英文不區分大小寫,所以也可以寫成“utf-8”。“UTF-8”也可以把中間的“-”省略,寫成“UTF8”。一般程序都能識別,但也有例外(如下文),為了嚴格一點,最好用標准的大寫“UTF-8”。只有在MySQL中可以使用“utf-8”的別名“utf8”,但是在其他地方一律使用大寫“UTF-8”。
網頁上Flash中的中文顯示為方框的解決辦法
編輯/etc/fonts/conf.d/49-sansserif.conf文件,作如下修改:
<edit name="family" mode="append_last">
<string>WenQuanYi Micro Hei</string>
</edit>
Java程序部分中文顯示為方框的解決辦法
在$JAVA_HOME/jre /lib/fonts目錄下建立fallback目錄,將中文字體文件復制(或link)到fallback目錄。
sudo mkdir $JAVA_HOME/jre/lib/fonts/fallback
sudo ln /usr/share/fonts/truetype/wqy/wqy-microhei.ttc $JAVA_HOME/jre/lib/fonts/fallback/
“GBK亂碼”,參考
亂碼的樣子類似:
à??ü òá??à3?£???1,°2à??ü òá??à3?£???1
解決方法:
convmv -r -f utf8 -t iso88591 --notest --nosmart * && convmv -r -f gbk -t utf8 --notest --nosmart * # 把亂碼文件名文件復制在一個空目錄里運行(這樣錯了也不怕):
“ascii亂碼”參考
亂碼的樣子類似:
%E5%8C%BB%E4%BF%9D
解決方法:
1.使用uni2ascii 代碼:echo 亂碼原文 | ascii2uni -a J
2.安裝nautilus-filename-repairer0.06(官方有源碼,但是依賴問題,我還沒安裝成功,而0.05版與現在的nautilus有點小小的合作障礙,只能看不能改名)
3.用chromeplus-1.3.3.1下載(因為這類亂碼主要在用ff(默認utf8)下載qq群里的文件之后產生,用chromeplus(默認GBK)下就沒問題了)
另外,至於文件里面內容的亂碼問題可以搜索enca.
解決Rhythmox亂碼問題:
安裝Rhythmox:sudo apt-get install rhythmbox
安裝mid3iconv:sudo apt-get install python-mutagen
mid3iconv -h
Clementine亂碼問題
安裝mid3iconv:sudo apt-get install python-mutagen
mid3iconv -h
Clementine不支持utf8,需要吧所有的mp3歌曲轉換為gbk格式,wma好像不用轉就可以
mid3iconv -e gbk *.mp3(由於不能帶-r參數,所以要依次進入每個文件夾)
另外clementine采用gstreamer作為后端,需要安裝gstreamer插件:
- 如果想支持mp3,需要安裝gstreamer-0.10-plugins-bad和gstreamer-0.10-plugins-ugly
- 如果想支持wma,需要安裝gstreamer-0.10-ffmpeg
- 如果想支持mms流媒體,需要安裝gstreamer plugins for mms
另外Clementine基於Amarok,所以支持Amarok的插件一般都支持Clementine,比如osdlyrics。
轉換文件內容編碼:
file -i <file name> 檢測文件編碼
iconv --help
轉換文件名編碼
sudo apt-get install convmv
convmv --help
convmv -f gbk -t utf8 -r --notest files
convmv -r -f utf8 -t iso88591 * --notest --nosmart && convmv -r -f gbk -t utf8 * --notest --nosmart
解決gedit亂碼問題:
gsettings set org.gnome.gedit.preferences.encodings auto-detected "['GB18030', 'GB2312', 'GBK', 'UTF-8', 'BIG5', 'CURRENT', 'UTF-16']"
gsettings set org.gnome.gedit.preferences.encodings shown-in-menu "['GB18030', 'GB2312', 'GBK', 'UTF-8', 'BIG5', 'CURRENT', 'UTF-16']"
解決PDF中文亂碼:
sudo apt-get install poppler-data
解決rar文件亂碼
使用rar
解壓zip文件亂碼
最近碰到這個問題,網上搜了一圈,都是什么unzip -O,一點用都沒有,這些哥們估計是直接復制,用都沒用過。后來找了個終極方法,用python的腳本來解壓,試了下,還真管用!!!以下為python腳本的代碼,新建文件jieya.py,寫入以下代碼:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import os
import sys
import zipfile
print "Processing File " + sys.argv[1]
file=zipfile.ZipFile(sys.argv[1],"r");
for name in file.namelist():
utf8name=name.decode('gbk')
print "Extracting " + utf8name
pathname = os.path.dirname(utf8name)
if not os.path.exists(pathname) and pathname!= "":
os.makedirs(pathname)
data = file.read(name)
if not os.path.exists(utf8name):
fo = open(utf8name, "w")
fo.write(data)
fo.close
file.close()
然后zip文件跟jieya.py放在同一級目錄,運行命令python jieya.py file.zip,哦了!
smplayer 中文字幕亂碼解決方法
- 打開選項-》首選現:選擇字幕選項卡。
- 找到“默認字符編碼”選項,在下拉框中選擇“簡體中文(cp936)”
- 再打開“字體”頁卡(上邊),選擇“系統字體”在下拉選框中選擇一種簡體中文字體,如 Weu Quanyi Zen Hei 等。
VLC播放器顯示文件名亂碼
初選項中修改一種支持中文的字體