PHP導出CSV文件出現亂碼的解決方法


  在做項目時碰到使用外語的情況下,我們就會使用UTF-8編碼。但是,在用PHP導出CSV文件時,如果寫入的數據是使用UTF-8編碼的日語、韓語之類的外文,就會出現亂碼。

  要解決PHP生成CSV文件的亂碼問題,只需要在文件的開始輸出BOM頭,告訴windows CSV文件的編碼方式,從而讓Excel打開CSV時采用正確的編碼。

 什么是BOM

    在UCS 編碼中有一個叫做”ZERO WIDTH NO-BREAK SPACE”的字符,它的編碼是FEFF。而FFFE在UCS中是不存在的字符,所以不應該出現在實際傳輸中。UCS規范建議我們在傳輸字節流前,先傳輸字符”ZERO WIDTH NO-BREAK SPACE”。這樣如果接收者收到FEFF,就表明這個字節流是Big-Endian的;如果收到FFFE,就表明這個字節流是Little-Endian的。因此 字符”ZERO WIDTH NO-BREAK SPACE”又被稱作BOM。UTF-8不需要BOM來表明字節順序,但可以用BOM來表明編碼方式。字符”ZERO WIDTH NO-BREAK SPACE”的UTF-8編碼是EF BB BF。所以如果接收者收到以EF BB BF開頭的字節流,就知道這是UTF-8編碼了。Windows就是使用BOM來標記文本文件的編碼方式的

  

  在所有內容輸出之前

print(chr(0xEF).chr(0xBB).chr(0xBF));


  幾個UTF編碼的BOM頭

   define ('UTF32_BIG_ENDIAN_BOM'   ,   chr(0x00) . chr(0x00) . chr(0xFE) . chr(0xFF));   define ('UTF32_LITTLE_ENDIAN_BOM',   chr(0xFF) . chr(0xFE) . chr(0x00) . chr(0x00));   define ('UTF16_BIG_ENDIAN_BOM' ,   chr(0xFE) . chr(0xFF));   define ('UTF16_LITTLE_ENDIAN_BOM',   chr(0xFF) . chr(0xFE));   define ('UTF8_BOM'   ,   chr(0xEF) . chr(0xBB) . chr(0xBF)); 
 
        

完整的代碼

 1      header('Expires: 0');
 2      header('Cache-control: private');
 3      header('Cache-Control: must-revalidate, post-check=0, pre-check=0');
 4      header('Content-Description: File Transfer');
 5      header('Content-Encoding: UTF-8');
 6      header('Content-type: text/csv; charset=UTF-8');
 7      header('Content-Disposition: attachment;            filename=Customers_Export.csv');
 8 
 9 echo "\xEF\xBB\xBF"; // UTF-8 BOM
10 // print(chr(0xEF).chr(0xBB).chr(0xBF));
11  

 

 
        
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM