使用 windows 子系统查看 windows 上面的GB2312编码格式的文本文件,想使用 Linux 的指令 iconv ,将其转换为 utf-8 文件,首先应该是查看此文件的编码
使用 file 指令
file [filename]
输出
[filename]: Non-ISO extended-ASCII text, with very long lines, with CRLF line terminators
可见并未给出明确的编码信息。
如此,不清楚文件编码无法使用 iconv 命令转换
所以使用另一个命令 enca , 正在使用的 ubuntu 18.08 没有自带 enca 命令,需要在线安装
sudo apt-get install enca
命令
enca [filename]
输出
Simplified Chinese National Standard; GB2312
CRLF line terminators
得知文件编码为GB2312,所以使用 iconv 命令
iconv -c -f GB2312 -t UTF-8 [filename] -o [filename.back]
完成文件的编码格式转换