向PHP要效率——加快你的代碼執行速度(strpos 快於 preg_match 快於 strstr 快於 ereg)


我們是一家媒體網站,每天都有大概1000+的原創文章,目前庫里大概有100多萬條數據,與地方一些站進行合作,有些ZF的毛病很多,需要屏蔽一些ZF認為違規關鍵字的文章。對方提供了20000+關鍵詞,需要掃我們的庫。

我現在需要做的就是把帶有違規關鍵字的文章id取出來,story表記錄簡單信息,content記錄了內容還有分頁。

用preg_match()每百條數據需要200s+, 采用strpos() 來檢測每百條只需要5s+ 這跑完也要好幾個小時

最好的辦法是使用coreseek來處理。

腳本語言效率都是低下的,PHP也不例外。而效率的高低實際上,都是在你的每一行代碼中節省或浪費的。所以,這里向你講解一些基本的效率常識,讓你的代碼執行速度快起來。
(注:看過N多版本的優化PHP代碼的建議,覺得不系統,也不全面,這里只是給出平常極需要注意的一些。)

一、字符串問題

1、字符中拼接大於數組的implode, 也快於sprintf

你可以執行一下下面的代碼:

Php代碼
<?php  

  

    /** 

     * Simple function to replicate PHP 5 behaviour 

     */  

    function microtime_float()  

    {  

        list($usec, $sec) = explode(" ", microtime());  

        return ((float)$usec + (float)$sec);  

    }  

      

    $start=microtime_float();  

      

    // standard string append     

    $str = '';     

    for ($i = 300000; $i > 0; $i--) {     

        $str .= 'String concatenation. ';     

    }    

      

    $end = microtime_float();  

  

  

    echo("<br/> t i m e :" .  round( $end - $start ,2) ."<br/>");  

      

    $start=microtime_float();  

      

    // array join     

    $str = '';     

    $sArr = array();     

    for ($i = 300000; $i > 0; $i--) {     

        $sArr[] = 'String concatenation. ';     

    }     

    $str = implode('',$sArr);    

      

    $end = microtime_float();  

  

    echo("<br/> t i m e :" .  round( $end - $start ,2) ."<br/>");      

  

?>  

我機器的輸出結果是:

t i m e :0.14

t i m e :0.25

2、字符串替換

同時,如果不能拼接,才考慮替換。而替換方式,要按以下的優先方式考慮寫代碼:

sprintf 快於 str_replace 快於 preg_replace 快於 strstr

3、字符串查找,字符串比較:

網上有人測試的結果是:

Results 
ereg .956 
preg_match .050 
strstr .222 
strpos .033 
可見:
strpos 快於 preg_match 快於 strstr 快於 ereg
有人說,strstr快,但,preg_match_all肯定比for循環中的strstr快,如果能夠explode,則還要比preg_match_all快

3、字符串輸出:
echo 快於 print, 這不用講了。 但是,如果將echo用到最快?

$foo = 'John SMITH';  
echo "Hello $foo, welcome on my blog.";  
echo "Hello " . $foo . " welcome on my blog.";  
echo 'Hello ' . $foo . ' welcome on my blog.';  
echo 'Hello ', $foo , ' welcome on my blog.'; 

我想,你能看得懂的,最后一個最快。


二、數組問題:

foreach 快於 for 這是大家都明白的。 不僅如此。如果真的用for ,你這樣寫是最好的

for($i=0,$j=count($array);$i<$j;$i++){
}

前面說了,數組用來做字串拼接,會慢,因為,你走了兩循環。但很多操作,如果能用數組協助完成,則會很快。
比如:array_map('trim',$array)肯定比你寫for,foreach要快很多。
能先用explode拆成數組,最好不要在for循環中使用strpos.

in_array函數的效率問題。如果in_array頻繁使用,而數組很大,建議將這個數組排序,然后,用fast_in_array

這是PHP手冊中的用戶添加的函數。(注:有待測試結果,小數組,in_array還是快於它)
This function is  five times faster than in_array(). It uses a binary search and should be  able to be used as a direct replacement: 

Php代碼  

<?php   

function fast_in_array($elem$array)   

{   

   $top = count($array) -1;   

   $bot = 0;   

  

   while($top >= $bot)   

   {   

      $p = floor(($top + $bot) / 2);   

      if ($array[$p] < $elem$bot = $p + 1;   

      elseif ($array[$p] > $elem$top = $p - 1;   

      else return TRUE;   

   }   

       

   return FALSE;   

}   

?>   

 

用數組改變你的所有能改變的控制結構。這不僅包括三元運算符,還有:if,switch。這還有另一好處,那就是能培養你的軟編碼模式的思維。

Instead of

   $class = $class == 'even' ? 'odd' : 'even'

we have

   $flip = array('even' => 'odd', 'odd' => 'even');
   $class = $flip[$class];
   
三、函數問題

使用正名函數,不要用函數的別名。別名在PHP中是用於PHP的推廣(比如split,join是VB中有的函數,implode,explode則是正名函數),或用於向舊版本兼容。一般速度沒有正名的快。
   
count 快於 sizeof
is_integer 快於 is_int
floatval 快於 doubleval
implode 快於 join
ini_set 快於 ini_alter 

當然,也有極個別的例外,比如:fputs 快於 fwrite, 我覺得,可以不管它。

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM