使用 windows 子系統查看 windows 上面的GB2312編碼格式的文本文件,想使用 Linux 的指令 iconv ,將其轉換為 utf-8 文件,首先應該是查看此文件的編碼
使用 file 指令
file [filename]
輸出
[filename]: Non-ISO extended-ASCII text, with very long lines, with CRLF line terminators
可見並未給出明確的編碼信息。
如此,不清楚文件編碼無法使用 iconv 命令轉換
所以使用另一個命令 enca , 正在使用的 ubuntu 18.08 沒有自帶 enca 命令,需要在線安裝
sudo apt-get install enca
命令
enca [filename]
輸出
Simplified Chinese National Standard; GB2312
CRLF line terminators
得知文件編碼為GB2312,所以使用 iconv 命令
iconv -c -f GB2312 -t UTF-8 [filename] -o [filename.back]
完成文件的編碼格式轉換