好了,進入代碼實戰階段,注意兩點:
-
我用的PHP版本是7.1.17(記住!這個很重要!不同版本的PHP有極大可能會出現不相同的結果!我試過6個版本的PHP,三個PHP5版本,三個HPP7版本,其中PHP7版本變化尤其多,但不影響業務代碼不會出bug,放心),運行環境是cli。
-
下面的原理解只針對PHP7,不再說5了。你面試的時候,只需要說5的我不太了解,7的我深入看過一些即可,面試官不會難為你的。
<?php
// 先不要問為什么非要加mt_rand,不然,絕筆說不過來了,到處都是坑
$a = 'hello'.mt_rand( 1, 1000 );
echo xdebug_debug_zval('a');
$b = a;
echo xdebug_debug_zval('a');
$c = a;
echo xdebug_debug_zval('a');
unset( $c );
echo xdebug_debug_zval('a');
以上代碼運行結果是將會是:
a: (refcount=1, is_ref=0)='hello916'
a: (refcount=2, is_ref=0)='hello916'
a: (refcount=3, is_ref=0)='hello916'
a: (refcount=2, is_ref=0)='hello916'
其中,zval struct結構體用於保存$a,zend_value union聯合體用於保存數據內容也就是'hello916'。由於后面又聲明了b和c,所以C不得不又在底層給你搞出兩個zval struct結構體來。
其中,zval和zend value的結構大概如下:(注意!!!這並不是完整正確的PHP zval和zend_value在C語言中struct和union實現,僅僅是挑出最重點的部分寫出來,強調一下:你沒有必要一個字不差背誦過zval和zend_value,你只需要知道原理)
zval {
string "a" //變量的名字是a
value zend_value //變量的值
type string //變量是字符串類型
}
zend_value {
string "hello916" //值的內容
refcount 1 //引用計數
}
看到上面兩個,如果面試官問你php變量為什么能夠保存字符串"123"也能保存數字123,你知道該怎么回答了吧?就答出重點zval中有該變量的類型,當是字符串123的時候,type就是string,此時value指向“123”;當是整數123的時候,zval的type為int,value為123。這就是答題的思想,這很重要!而且,通過C語言都是可以實現的!具體真正的val和zend_value的模樣,有興趣的同學可以去網上搜搜,如果你沒有C語言的底子,可能比較吃力!前者是一個struct結構體,后者是一個union聯合體!
這個refcount就是傳說中的引用計數了,初始化的時候a后面的引用次數為1(注意,正確說法應該是a后面的賦值的數組zend_value引用計數為1,而不是a這個變量zval本身)。然后我們將$b = $a,其實相當於又一個變量指向了這個zend_value,所以refcount變為2,最后將$c = $a,同理,zend_value的refcount再次加1變成了3。然后,我們用unset( $c ),這會兒,C語言要做的就是把$c的zval給KO free掉,但是並不是free zend_value,這會兒zend_value的refcount就自然而然減1變成2了。
那么寫時拷貝是什么意思呢?看下面代碼:
<?php
// 先不要問為什么非要加mt_rand,不然,絕筆說不過來了,到處都是坑
$a = 'hello'.mt_rand( 1, 1000 );
$b = $a;
$a = 123;
echo $b.PHP_EOL;
// 運行結果,不用我說吧,腳趾頭都知道是'hello'.mt_rand( 1, 1000 )的結果,絕對不可能是123。
其實,當你把$a賦值給$b的時候,$a的值並沒有真的復制了一份,這樣是對內存的極度不尊重,也是對時間復雜度的極度不尊重,計算機僅僅是將$b指向了$a的值而已,這就叫多快好省。那么,什么時候真正的發生復制呢?就是當我們修改$a的值為123的時候,這個時候就不得已進行復制,避免$b的值和$a的一樣。
<?php
$a = 'hello'.mt_rand( 1, 1000 );
$b = $a;
echo xdebug_debug_zval('a');
$a = 'world'.mt_rand( 2, 2000 );
echo xdebug_debug_zval('a');
// 運行結果為1,其中的原理你自己應該能理順了昂
叨逼叨了這么長,通過簡單的案例解釋清楚了兩個要點:引用計數和寫時拷貝,那么垃圾回收也該來了。當一個zval在被unset的時候、或者從一個函數中運行完畢出來(就是局部變量)的時候等等很多地方,都會產生zval與zend_value發生斷開的行為,這個時候zend引擎需要檢測的就是zend_value的refcount是否為0,如果為0,則直接KO free空出內容來。如果zend_value的recount不為0(廢話一定是大於0),這個value不能被釋放,但是也不代表這個zend_value是清白的,因為此zend_value依然可能是個垃圾。
什么樣的情況會導致zend_value的refcount不為0,但是這個zend_value卻是個垃圾呢?PHP7種兩種情況:
-
數組:a數組的某個成員使用&引用a自己
-
對象:對象的某個成員引用對象自己
請理(bei)解(song),一般面試,你能回答到這一步,已經非常屌了。
<?php
$arr = [ 1 ];
$arr[] = &$arr;
unset( $arr );
這種情況下,zend_value不會能釋放,但也不能放過它,不然一定會產生內存泄漏,所以這會兒zend_value會被扔到一個叫做垃圾回收堆中,然后zend引擎會依次對垃圾回收堆中的這些zend_value進行二次檢測,檢測是不是由於上述兩種情況造成的refcount為1但是自身卻確實沒有人再用了,如果一旦確定是上述兩種情況造成的,那么就會將zend_value徹底抹掉釋放內存。
那么垃圾回收發生在什么時候?有些同學可能有疑問,就是php不是運行一次就銷毀了嗎,我要着gc有何用?並不是啦,首先當一次fpm運行完畢后,最后一定還有gc的,這個銷毀就是gc;其次是,內存都是即用即釋放的,而不是攢着非得到最后,你想想一個典型的場景,你的控制器里的某個方法里用了一個函數,函數需要一個巨大的數組參數,然后函數還需要修改這個巨大的數組參數,你們應該是函數的運行范圍里面修改這個數組,所以此時會發生寫時拷貝了,當函數運行完畢后,就得趕緊釋放掉這塊兒內存以供給其他進程使用,而不是非得等到本地fpm request徹底完成后才銷毀。
說到最后,說些自己的話:大多數情況下,面試官問你問題主要是想一是要你個思維思路,二是看你學習程度。就像gc這個問題,其實很多腳本語言的垃圾回收機制基本上都是靠引用計數和寫時拷貝這兩種算法結合完成的,所以如果你設計一門腳本語言,gc機制就按照這兩種算法進行設計即可。其次是大多數phper不會看這些東西的,面試官問你這個問題不是要你死記硬背那么多細節,你背不過的,他還是想探測你平時有沒有更積極地往深層發展的心態。
第一次寫面試題答案,但是發現篇幅真的不夠,經驗不太夠,感覺寫不是特別如心意,可能是我想說的太多,總想當成博客寫,但是並不能,不然就弄不完,所以只能就着可以應付面試官的主題思想來寫這種,注重體現重點,很多細節實在沒法寫,比如我舉個例子$a=[],然后xdebug_debug_zval( $a )的refcount值你猜是多少?7.1.17下竟然是2,你是不是以為是1,然而並不是。不過你不用糾結這些細節,gc的關鍵就是能說出引用計數的原理和寫時拷貝,很多細節深處都各種奇奇怪怪的東西,面試官自己都不一定知道。