java文件讀寫操作指定編碼格式


讀文件:

BufferedReader

從字符輸入流中讀取文本,緩沖各個字符,從而提供字符、數組和行的高效讀取。

可以指定緩沖區的大小,或者可使用默認的大小。大多數情況下,默認值就足夠大了。

通常,Reader 所作的每個讀取請求都會導致對基礎字符或字節流進行相應的讀取請求。因此,建議用 BufferedReader 包裝所有其 read() 操作可能開銷很高的 Reader(如 FileReader 和 InputStreamReader)。例如,

 BufferedReader in
   = new BufferedReader(new FileReader("foo.in"));
 將緩沖指定文件的輸入。如果沒有緩沖,則每次調用 read() 或 readLine() 都會導致從文件中讀取字節,並將其轉換為字符后返回,而這是極其低效的。
可以對使用 DataInputStream 進行按原文輸入的程序進行本地化,方法是用合適的 BufferedReader 替換每個 DataInputStream。

為了指定文件的編碼方式,再進入如下修改:
//BufferedReader in = new BufferedReader(new FileReader(saveFilename));
BufferedReader in = new BufferedReader(new InputStreamReader(new FileInputStream(saveFilename),"GB2312"));


寫文件:

BufferedWriter

將文本寫入字符輸出流,緩沖各個字符,從而提供單個字符、數組和字符串的高效寫入。

可以指定緩沖區的大小,或者接受默認的大小。在大多數情況下,默認值就足夠大了。

該類提供了 newLine() 方法,它使用平台自己的行分隔符概念,此概念由系統屬性 line.separator 定義。並非所有平台都使用新行符 ('\n') 來終止各行。因此調用此方法來終止每個輸出行要優於直接寫入新行符。

通常 Writer 將其輸出立即發送到基礎字符或字節流。除非要求提示輸出,否則建議用 BufferedWriter 包裝所有其 write() 操作可能開銷很高的 Writer(如 FileWriters 和 OutputStreamWriters)。例如,

 PrintWriter out
   = new PrintWriter(new BufferedWriter(new FileWriter("foo.out")));
 將緩沖 PrintWriter 對文件的輸出。如果沒有緩沖,則每次調用 print() 方法會導致將字符轉換為字節,然后立即寫入到文件,而這是極其低效的。


為了指定文件的編碼方式:
PrintWriter out = new PrintWriter(new BufferedWriter(new OutputStreamWriter(new FileOutputStream(saveFilename),"GB2312")));

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

package  com.mkyong;
 
import  java.io.BufferedReader;
import  java.io.File;
import  java.io.FileInputStream;
import  java.io.InputStreamReader;
 
public  class  UTF8To<a href= "https://www.baidu.com/s?wd=GBK&tn=44039180_cpr&fenlei=mv6quAkxTZn0IZRqIHckPjm4nH00T1YLPWfdnA7bnWN-uHRsmvu-0ZwV5Hcvrjm3rH6sPfKWUMw85HfYnjn4nH6sgvPsT6KdThsqpZwYTjCEQLGCpyw9Uz4Bmy-bIi4WUvYETgN-TLwGUv3EnHnsnHbknW6YPWRsrHbYPWRLrf" target= "_blank" class = "baidu-highlight" >GBK</a> {
     public  static  void  main(String[] args)  throws  Exception {
 
         File fileDir =  new  File( "/home/user/Desktop/Unsaved Document 1" );
 
         BufferedReader in =  new  BufferedReader( new  InputStreamReader(
                 new  FileInputStream(fileDir),  "UTF-8" ));
 
         String str;
 
         while  ((str = in.readLine()) !=  null ) {
             System.out.println(str); // java內部只有unicode編碼 所以str是unicode編碼
             String str2 =  new  String(str.getBytes( "<a href=" https: //www.baidu.com/s?wd=GBK&tn=44039180_cpr&fenlei=mv6quAkxTZn0IZRqIHckPjm4nH00T1YLPWfdnA7bnWN-uHRsmvu-0ZwV5Hcvrjm3rH6sPfKWUMw85HfYnjn4nH6sgvPsT6KdThsqpZwYTjCEQLGCpyw9Uz4Bmy-bIi4WUvYETgN-TLwGUv3EnHnsnHbknW6YPWRsrHbYPWRLrf" target="_blank" class="baidu-highlight">GBK</a>"), "GBK");// str.getBytes("GBK")是gbk編碼,但是str2是unicode編碼
             System.out.println(str2);
         }
 
         in.close();
     }
}

 

 問題的關鍵是new String(xxx.getBytes("gbk"), "gbk")這句話是什么意思,xxx.getBytes("gbk")是GBK編碼,所以java是不能夠正確輸出的,因此必須通過new String(xxx.getBytes("gbk"), "gbk")把xxx.getBytes("gbk")的GBK編碼變成unicode編碼,因此你要的GBK就是str.getBytes("GBK")這就是GBK編碼,不過你是不能夠輸出的,因此java不支持輸出GBK

 

String fullStr =  new  String(str.getBytes( "UTF-8" ),  "UTF-8" ); //正常
String fullStr2 =  new  String(str.getBytes( "UTF-8" ),  "GBK" ); //不正常,編碼不一致搜索UTF-8的編碼怎么能夠解讀為 GBK

 

看一下jdk文檔是怎么說的

 

public  String( byte [] bytes,
       Charset charset)

 

Constructs a new String by decoding the specified array of bytes using the specified charset.

 

str.getBytes( "GBK" )

 

應該就是你要傳遞給接口的

 

那現在的問題就是,我怎么在String中持有GBK編碼的東西呢?

 

String str3 =  new  String(str.getBytes( "GBK" ), "ISO-8859-1" );
System.out.println( new  String(str3.getBytes( "ISO-8859-1" ), "GBK" ));

str3就是可以傳遞給后台的的字符串


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM