查看文件編碼的Linux命令


使用 windows 子系統查看 windows 上面的GB2312編碼格式的文本文件,想使用 Linux 的指令 iconv ,將其轉換為 utf-8 文件,首先應該是查看此文件的編碼
使用 file 指令

file [filename]

輸出

[filename]: Non-ISO extended-ASCII text, with very long lines, with CRLF line terminators

可見並未給出明確的編碼信息。
如此,不清楚文件編碼無法使用 iconv 命令轉換
所以使用另一個命令 enca , 正在使用的 ubuntu 18.08 沒有自帶 enca 命令,需要在線安裝

sudo apt-get install enca

命令

enca [filename]

輸出

Simplified Chinese National Standard; GB2312
  CRLF line terminators

得知文件編碼為GB2312,所以使用 iconv 命令

iconv -c -f GB2312 -t UTF-8 [filename] -o [filename.back]

完成文件的編碼格式轉換


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM