linux下解壓縮文件中文亂碼問題的解決


在windows上壓縮的文件,是以系統默認編碼中文來壓縮文件。由於zip文件中沒有聲明其編碼,所以linux上的unzip一般以默認編碼解壓,中文文件名會出現亂碼。
雖然2005年就有人把這報告為bug, 但是info-zip的官方網站沒有把自動識別編碼列入計划,可能他們不認為這是個問題。Sun對java中存在N年的zip編碼問題,采用了同樣的處理方式。

有2種方式解決問題:

  1. 通過unzip行命令解壓,指定字符集

    unzip -O CP936 xxx.zip (用GBK, GB18030也可以)

    有趣的是unzip的manual中並無這個選項的說明, unzip --help對這個參數有一行簡單的說明。

  2. 在環境變量中,指定unzip參數,總是以指定的字符集顯示和解壓文件

    /etc/environment中加入2行

    UNZIP="-O CP936"

    ZIPINFO="-O CP936"

這樣Gnome桌面的歸檔文件管理器(file-roller)可以正常使用unzip解壓中文,但是file-roller本身並不能設置編碼傳遞給unzip。

轉載地址:http://forum.ubuntu.org.cn/viewtopic.php?f=122&t=175405&p=1343326


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM