java文件讀寫操作指定編碼格式

本文轉載自查看原文 2017-03-16 19:54 27744 Java

讀文件：

BufferedReader

從字符輸入流中讀取文本，緩沖各個字符，從而提供字符、數組和行的高效讀取。

可以指定緩沖區的大小，或者可使用默認的大小。大多數情況下，默認值就足夠大了。

通常，Reader 所作的每個讀取請求都會導致對基礎字符或字節流進行相應的讀取請求。因此，建議用 BufferedReader 包裝所有其 read() 操作可能開銷很高的 Reader（如 FileReader 和 InputStreamReader）。例如，

BufferedReader in
= new BufferedReader(new FileReader("foo.in"));
將緩沖指定文件的輸入。如果沒有緩沖，則每次調用 read() 或 readLine() 都會導致從文件中讀取字節，並將其轉換為字符后返回，而這是極其低效的。
可以對使用 DataInputStream 進行按原文輸入的程序進行本地化，方法是用合適的 BufferedReader 替換每個 DataInputStream。

為了指定文件的編碼方式，再進入如下修改：
//BufferedReader in = new BufferedReader(new FileReader(saveFilename));
BufferedReader in = new BufferedReader(new InputStreamReader(new FileInputStream(saveFilename),"GB2312"));

寫文件：

BufferedWriter

將文本寫入字符輸出流，緩沖各個字符，從而提供單個字符、數組和字符串的高效寫入。

可以指定緩沖區的大小，或者接受默認的大小。在大多數情況下，默認值就足夠大了。

該類提供了 newLine() 方法，它使用平台自己的行分隔符概念，此概念由系統屬性 line.separator 定義。並非所有平台都使用新行符 ('\n') 來終止各行。因此調用此方法來終止每個輸出行要優於直接寫入新行符。

通常 Writer 將其輸出立即發送到基礎字符或字節流。除非要求提示輸出，否則建議用 BufferedWriter 包裝所有其 write() 操作可能開銷很高的 Writer（如 FileWriters 和 OutputStreamWriters）。例如，

PrintWriter out
= new PrintWriter(new BufferedWriter(new FileWriter("foo.out")));
將緩沖 PrintWriter 對文件的輸出。如果沒有緩沖，則每次調用 print() 方法會導致將字符轉換為字節，然后立即寫入到文件，而這是極其低效的。

為了指定文件的編碼方式:
PrintWriter out = new PrintWriter(new BufferedWriter(new OutputStreamWriter(new FileOutputStream(saveFilename),"GB2312")));

 
           package  
           com.mkyong; 
          
           import  
           java.io.BufferedReader; 
          
           import  
           java.io.File; 
          
           import  
           java.io.FileInputStream; 
          
           import  
           java.io.InputStreamReader; 
          
           public  
           class  
           UTF8To<a href= 
           "https://www.baidu.com/s?wd=GBK&tn=44039180_cpr&fenlei=mv6quAkxTZn0IZRqIHckPjm4nH00T1YLPWfdnA7bnWN-uHRsmvu-0ZwV5Hcvrjm3rH6sPfKWUMw85HfYnjn4nH6sgvPsT6KdThsqpZwYTjCEQLGCpyw9Uz4Bmy-bIi4WUvYETgN-TLwGUv3EnHnsnHbknW6YPWRsrHbYPWRLrf" 
           target= 
           "_blank" 
           class 
           = 
           "baidu-highlight" 
           >GBK</a> { 
          
           public  
           static  
           void  
           main(String[] args)  
           throws  
           Exception { 
          
           File fileDir =  
           new  
           File( 
           "/home/user/Desktop/Unsaved Document 1" 
           ); 
          
           BufferedReader in =  
           new  
           BufferedReader( 
           new  
           InputStreamReader( 
          
           new  
           FileInputStream(fileDir),  
           "UTF-8" 
           )); 
          
           String str; 
          
           while  
           ((str = in.readLine()) !=  
           null 
           ) { 
          
           System.out.println(str); 
           // java內部只有unicode編碼 所以str是unicode編碼 
          
           String str2 =  
           new  
           String(str.getBytes( 
           "<a href=" 
           https: 
           //www.baidu.com/s?wd=GBK&tn=44039180_cpr&fenlei=mv6quAkxTZn0IZRqIHckPjm4nH00T1YLPWfdnA7bnWN-uHRsmvu-0ZwV5Hcvrjm3rH6sPfKWUMw85HfYnjn4nH6sgvPsT6KdThsqpZwYTjCEQLGCpyw9Uz4Bmy-bIi4WUvYETgN-TLwGUv3EnHnsnHbknW6YPWRsrHbYPWRLrf" target="_blank" class="baidu-highlight">GBK</a>"), "GBK");// str.getBytes("GBK")是gbk編碼，但是str2是unicode編碼 
          
           System.out.println(str2); 
          
           } 
          
           in.close(); 
          
           } 
          
           }

問題的關鍵是new String(xxx.getBytes("gbk"), "gbk")這句話是什么意思，xxx.getBytes("gbk")是GBK編碼，所以java是不能夠正確輸出的，因此必須通過new String(xxx.getBytes("gbk"), "gbk")把xxx.getBytes("gbk")的GBK編碼變成unicode編碼，因此你要的GBK就是str.getBytes("GBK")這就是GBK編碼，不過你是不能夠輸出的，因此java不支持輸出GBK

String fullStr = new String(str.getBytes( "UTF-8" ), "UTF-8" ); //正常

String fullStr2 = new String(str.getBytes( "UTF-8" ), "GBK" ); //不正常，編碼不一致UTF-8的編碼怎么能夠解讀為 GBK

看一下jdk文檔是怎么說的

public String( byte [] bytes,

Charset charset)

Constructs a new String by decoding the specified array of bytes using the specified charset.

str.getBytes( "GBK" )

應該就是你要傳遞給接口的

那現在的問題就是，我怎么在String中持有GBK編碼的東西呢？

String str3 = new String(str.getBytes( "GBK" ), "ISO-8859-1" );

System.out.println( new String(str3.getBytes( "ISO-8859-1" ), "GBK" ));

str3就是可以傳遞給后台的的字符串

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Java文件讀寫操作指定編碼方式。。。。。 pom文件指定編碼格式 java指定編碼的按行讀寫txt文件（幾種讀寫方式的比較） [轉]java按指定編碼寫入和讀取文件內容的類 java運行jar文件時指定編碼 unzip命令指定編碼格式 .Net Core 指定編碼格式的問題 unzip命令指定編碼格式 java讀取文件並獲得文件編碼，轉換為指定編碼的工具類代碼 c#讀取並異步寫入文件，簡單版，指定編碼，保持原格式。