我們之前都是使用PHPexcel導出我們的一些數據的,由於Phpexcel對導出超出1萬條數據會導至超時和內存暴漲,后來我們就改用數據導出成csv格式的。
相信很多朋友們在用PHP導出csv文件時都遇到各種亂碼問題。網上搜了一堆都是用加BOM的方式來解決,這個方法我試了好多次在我們的測試和生產環境下都不管用,不知道是為什么。
后來使用iconv方法將導出的內容轉碼由utf-8轉為gb2312,奇跡終於出來了,可以正常顯示了,不過經同事發現,我們導出400多條數據里竟然少了幾十條數據(我是一條一條轉碼然后拼接出出的csv字符串)。於是到度娘上找iconv轉碼失敗的問題,發現iconv原來是有BUG的,對於某些中文字轉不了,轉不了還不能跳過然后返回空值,是這個原因導致少了幾十條數據,同時給出了用mb_convert_encoding 這個方法來轉換。於是稍作修改就改成了用mb_convert_encoding方法了,在本地機測試非常正常,代碼如下:
$str = mb_convert_encoding($str,'gb2312');
但發布到線上導出數據還是一堆亂碼,但與之前不作轉碼時的亂碼還不一樣,說明mb_convert_encoding方法是起作用的。查了一下mb_convert_encoding方法有三個參數$from_encoding,第三個參數是可選參數,網上大多數的示例都是不使用第三個參數的,第三個參數默認也是null值。於是我把它用起來改成
$str = mb_convert_encoding($str,'gb2312','utf-8');
在本地開發機上測試是正常的,發布到生產環境,吼吼,一切正常了。
這究竟是為什么? 真沒時間去深究了,有知道的同學請告訴我一下吧
