php preg_replace空格無法替換問題


一次坑爹的小bug。讀取一段文字(編碼utf-8),想替換掉空格,str_replace(" "..)、preg_replace("/\s/"..)都不起作用。

 

1 <?php
2 
3 $str = '<p>    你好<p>';
4 $str = preg_replace('/\s/is','',$c);
5 $str = str_replace(" ", "a", $str); 
6 var_dump($str); //不起作用

 

沒辦法,將替換不了的空格ord()下才看到,這個utf-8空格比較特殊。ASCII 194 + 160出來的。

 

1 <?php
2 
3 $str = '<p>    你好<p>';
4 $str = str_replace(chr(194) . chr(160), "a", $str);  // 解決方法1
5 $str = preg_replace('/\xC2\xA0/is', "a", $str);  // 解決方法2
6 var_dump($str); //ok

 

 

問題的根源,在於UTF-8這種編碼里面,存在一個特殊的字符,其編碼是“0xC2 0xA0”(194 160),轉換成字符的時候,表現為一個空格,跟一般的半角空格(ASCII 0x20)一樣,唯一的不同是它的寬度不會被壓縮,因此比較多的被用於網頁排版(如首行縮進之類)。而其他的編碼方式如GB2312、Unicode之類並沒有這樣的字符。

整理遇到的各種無法替換的字符:

chr(194).chr(160) 變現為空格

chr(227).chr(128) 變現為空格

chr(226).chr(128).chr(172).chr(226).chr(128).chr(172).chr(30) 變現為空

 

 

總結:替換不了的字符,打印出ASCII碼來總能替換掉吧。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM