查看文件编码的Linux命令


使用 windows 子系统查看 windows 上面的GB2312编码格式的文本文件,想使用 Linux 的指令 iconv ,将其转换为 utf-8 文件,首先应该是查看此文件的编码
使用 file 指令

file [filename]

输出

[filename]: Non-ISO extended-ASCII text, with very long lines, with CRLF line terminators

可见并未给出明确的编码信息。
如此,不清楚文件编码无法使用 iconv 命令转换
所以使用另一个命令 enca , 正在使用的 ubuntu 18.08 没有自带 enca 命令,需要在线安装

sudo apt-get install enca

命令

enca [filename]

输出

Simplified Chinese National Standard; GB2312
  CRLF line terminators

得知文件编码为GB2312,所以使用 iconv 命令

iconv -c -f GB2312 -t UTF-8 [filename] -o [filename.back]

完成文件的编码格式转换


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM