php檢測文件編碼方法[非完美]


關於文件編碼的檢測,百度一下一大把都是,但是確實沒有能用的、
很多人建議 mb_detect_encoding 檢測,可是不知為何我這不成功,什么都沒輸出、
看到有人寫了個增強版,用 BOM 判斷的,我果斷就無視了,這東西完全不靠譜、
最終根據PHP手冊里 mb_detect_encoding 函數下方的例子,自己寫了一個檢測函數,
還包括自動檢測編碼並按指點編碼讀取文件的函數、
源碼獻上,不喜勿噴。
網上的方法我試過沒用才寫的,說不定環境不一樣導致的。
所以萬一沒用,也別噴我,我只是共享想思路而已、、

<?php
/**
 * 檢測文件編碼
 * @param string $file 文件路徑
 * @return string|null 返回 編碼名 或 null
 */
function detect_encoding($file) {
    $list = array('GBK', 'UTF-8', 'UTF-16LE', 'UTF-16BE', 'ISO-8859-1');
    $str = file_get_contents($file);
    foreach ($list as $item) {
        $tmp = mb_convert_encoding($str, $item, $item);
        if (md5($tmp) == md5($str)) {
            return $item;
        }
    }
    return null;
}

/**
 * 自動解析編碼讀入文件
 * @param string $file 文件路徑
 * @param string $charset 讀取編碼
 * @return string 返回讀取內容
 */
function auto_read($file, $charset='UTF-8') {
    $list = array('GBK', 'UTF-8', 'UTF-16LE', 'UTF-16BE', 'ISO-8859-1');
    $str = file_get_contents($file);
    foreach ($list as $item) {
        $tmp = mb_convert_encoding($str, $item, $item);
        if (md5($tmp) == md5($str)) {
            return mb_convert_encoding($str, $charset, $item);
        }
    }
    return "";
}

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM