【Java IO知识】读取中文乱码问题解决


读取文件主要是要设置读取的输入流如InputStreamReader时要设置读取的解码格式,要和文件本身的编码格式相同,这样读取出来的才不会乱码。

InputStreamReader reader = new InputStreamInputReader(input, "编码格式");

ANSI是"gbk"

注:必须是在读取的时候就使用正确的解码格式否则都会乱码!!!!

而要转换编码格式也只有正确读取后才能转,否则转换不会成功还是会乱码。

更改格式的方法:

  str.getByte[]("编码格式");

  new String(str.getByte[](), "要转换的格式")

java读取txt文件,如果编码格式不匹配,就会出现乱码现象,所以读取txt文件的时候需要设置读取编码。txt文档编码格式都是写在文件头的,在程序中需要先解析文件的编码格式,获得编码格式后,在按此格式读取文件就不会产生乱码了。

  1. InputStream inputStream = new FileInputStream("E:/1.txt");  
  2.         byte[] head = new byte[3];  
  3.         inputStream.read(head);   
  4.         String code = "";  
  5.    
  6.             code = "gb2312";  
  7.         if (head[0] == -1 && head[1] == -2 )  
  8.             code = "UTF-16";  
  9.         if (head[0] == -2 && head[1] == -1 )  
  10.             code = "Unicode";  
  11.         if(head[0]==-17 && head[1]==-69 && head[2] ==-65)  
  12.             code = "UTF-8"; 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM