【Java IO知識】讀取中文亂碼問題解決


讀取文件主要是要設置讀取的輸入流如InputStreamReader時要設置讀取的解碼格式,要和文件本身的編碼格式相同,這樣讀取出來的才不會亂碼。

InputStreamReader reader = new InputStreamInputReader(input, "編碼格式");

ANSI是"gbk"

注:必須是在讀取的時候就使用正確的解碼格式否則都會亂碼!!!!

而要轉換編碼格式也只有正確讀取后才能轉,否則轉換不會成功還是會亂碼。

更改格式的方法:

  str.getByte[]("編碼格式");

  new String(str.getByte[](), "要轉換的格式")

java讀取txt文件,如果編碼格式不匹配,就會出現亂碼現象,所以讀取txt文件的時候需要設置讀取編碼。txt文檔編碼格式都是寫在文件頭的,在程序中需要先解析文件的編碼格式,獲得編碼格式后,在按此格式讀取文件就不會產生亂碼了。

  1. InputStream inputStream = new FileInputStream("E:/1.txt");  
  2.         byte[] head = new byte[3];  
  3.         inputStream.read(head);   
  4.         String code = "";  
  5.    
  6.             code = "gb2312";  
  7.         if (head[0] == -1 && head[1] == -2 )  
  8.             code = "UTF-16";  
  9.         if (head[0] == -2 && head[1] == -1 )  
  10.             code = "Unicode";  
  11.         if(head[0]==-17 && head[1]==-69 && head[2] ==-65)  
  12.             code = "UTF-8"; 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM