奇怪的PHP引用效率問題分析
更新時間:2012年03月23日 00:46:23 作者:
最近寫了一個小的php程序處理日志中的ip,需要將每個日志中出現(xiàn)的ip都接上一個出現(xiàn)時間戳的鏈表,于是按行遍歷log日志并寫了一個update_timequeue的函數(shù)來插入時間戳節(jié)點
函數(shù)如下:
function update_timelist(&$arr,$timestamp,$threshold){
$timequeue = &$arr['timequeue'];
while(!empty($timequeue[0])&&($timestamp-$timequeue[0])>$threshold){
array_shift($timequeue);
}
array_push($timequeue, $timestamp);
if($arr['count']<count($timequeue)){
$arr['count'] = count($timequeue);
}
}
大家看出來這個函數(shù)有什么問題了沒有?其實,有很大一個問題,就是函數(shù)中的:
$timequeue = &$arr['timequeue'];
這一行導(dǎo)致程序讀入22M數(shù)據(jù)并生成時間節(jié)點鏈表用了接近40秒,而刪掉該行改成直接使用$arr['timequeue']時間就縮短了30秒,只需要10秒左右就處理完了22M。
function update_timelist(&$arr,$timestamp,$threshold){
while(!empty($arr['timequeue'][0])&&($timestamp-$arr['timequeue'][0])>$threshold){
array_shift($arr['timequeue']);
}
array_push($arr['timequeue'], $timestamp);
if($arr['count']<count($arr['timequeue'])){
$arr['count'] = count($arr['timequeue']);
}
大家看出來是什么問題了嗎?問題就count函數(shù)上,沒有想到吧。PHP將變量指向的真正的內(nèi)容空間標(biāo)記為了引用類型和非引用類型,像下面的代碼:
$a = 'jb51.net';
$b = $a;
$c = $b;
實際占用內(nèi)存空間只有一份,因為PHP的zend引擎使用copy on writing的機制,只在$b,$c修改的時候才會復(fù)制一份'jb51.net'過來,此時'jb51.net'的內(nèi)容空間類型為非引用類型,如果改為下面的代碼:
$a = 'jb51.net';
$b = $a;
$c = &$a;
這個會有什么變化?仍然是一份內(nèi)存空間存放'jb51.net'嗎?不是,因為$c為$a的引用,$a的指向的存儲空間需要標(biāo)記為引用類型,那么必須為$b單獨復(fù)制一份'jb51.net'才行了,因為$b指向的是非引用類型。
我們可以這樣理解,$c現(xiàn)在是$a的引用了,如果$b仍然執(zhí)行$a的空間那么修改$c將導(dǎo)致$b也修改,所以此時一旦出現(xiàn)引用即使沒有寫操作也必須復(fù)制一份了。也可以這樣理解,php對變量指向的內(nèi)存空間只有非引用和引用兩種類型,兩種類型不能混合,不能轉(zhuǎn)移。如果什么地方需要改變內(nèi)存空間的狀態(tài)則需要copy一份了。
下面就說明為什么多了$timequeue = &$arr['timequeue']會導(dǎo)致count變慢,還記得c函數(shù)的調(diào)用過程嗎?實際我們傳入的參數(shù)需要copy一份拷貝傳入,php也一樣,但是由于copy on writing機制使得count在傳入非引用類型時是不會真正copy的,但是$timequeue = &$arr['timequeue']將$timequeue的內(nèi)存空間指定為了引用類型,而count需要非引用類型,這樣就導(dǎo)致count需要copy一份$arr['timequeue']了。直接傳入$arr['timequeue']為什么沒有問題?count當(dāng)然是用了copy on writing的機制,array_shift和array_push呢?他們是傳入的引用啊,不用擔(dān)心這不是修改了$arr['timequeue']的類型而是真正的傳入了$arr['timequeue']的一個別名。
對于PHP我也是剛剛開始學(xué)習(xí),上面的分析不一定正確,也不一定全面。大家可以在我的主頁發(fā)郵件留言與我交流。
復(fù)制代碼 代碼如下:
function update_timelist(&$arr,$timestamp,$threshold){
$timequeue = &$arr['timequeue'];
while(!empty($timequeue[0])&&($timestamp-$timequeue[0])>$threshold){
array_shift($timequeue);
}
array_push($timequeue, $timestamp);
if($arr['count']<count($timequeue)){
$arr['count'] = count($timequeue);
}
}
大家看出來這個函數(shù)有什么問題了沒有?其實,有很大一個問題,就是函數(shù)中的:
$timequeue = &$arr['timequeue'];
這一行導(dǎo)致程序讀入22M數(shù)據(jù)并生成時間節(jié)點鏈表用了接近40秒,而刪掉該行改成直接使用$arr['timequeue']時間就縮短了30秒,只需要10秒左右就處理完了22M。
復(fù)制代碼 代碼如下:
function update_timelist(&$arr,$timestamp,$threshold){
while(!empty($arr['timequeue'][0])&&($timestamp-$arr['timequeue'][0])>$threshold){
array_shift($arr['timequeue']);
}
array_push($arr['timequeue'], $timestamp);
if($arr['count']<count($arr['timequeue'])){
$arr['count'] = count($arr['timequeue']);
}
大家看出來是什么問題了嗎?問題就count函數(shù)上,沒有想到吧。PHP將變量指向的真正的內(nèi)容空間標(biāo)記為了引用類型和非引用類型,像下面的代碼:
復(fù)制代碼 代碼如下:
$a = 'jb51.net';
$b = $a;
$c = $b;
實際占用內(nèi)存空間只有一份,因為PHP的zend引擎使用copy on writing的機制,只在$b,$c修改的時候才會復(fù)制一份'jb51.net'過來,此時'jb51.net'的內(nèi)容空間類型為非引用類型,如果改為下面的代碼:
復(fù)制代碼 代碼如下:
$a = 'jb51.net';
$b = $a;
$c = &$a;
這個會有什么變化?仍然是一份內(nèi)存空間存放'jb51.net'嗎?不是,因為$c為$a的引用,$a的指向的存儲空間需要標(biāo)記為引用類型,那么必須為$b單獨復(fù)制一份'jb51.net'才行了,因為$b指向的是非引用類型。
我們可以這樣理解,$c現(xiàn)在是$a的引用了,如果$b仍然執(zhí)行$a的空間那么修改$c將導(dǎo)致$b也修改,所以此時一旦出現(xiàn)引用即使沒有寫操作也必須復(fù)制一份了。也可以這樣理解,php對變量指向的內(nèi)存空間只有非引用和引用兩種類型,兩種類型不能混合,不能轉(zhuǎn)移。如果什么地方需要改變內(nèi)存空間的狀態(tài)則需要copy一份了。
下面就說明為什么多了$timequeue = &$arr['timequeue']會導(dǎo)致count變慢,還記得c函數(shù)的調(diào)用過程嗎?實際我們傳入的參數(shù)需要copy一份拷貝傳入,php也一樣,但是由于copy on writing機制使得count在傳入非引用類型時是不會真正copy的,但是$timequeue = &$arr['timequeue']將$timequeue的內(nèi)存空間指定為了引用類型,而count需要非引用類型,這樣就導(dǎo)致count需要copy一份$arr['timequeue']了。直接傳入$arr['timequeue']為什么沒有問題?count當(dāng)然是用了copy on writing的機制,array_shift和array_push呢?他們是傳入的引用啊,不用擔(dān)心這不是修改了$arr['timequeue']的類型而是真正的傳入了$arr['timequeue']的一個別名。
對于PHP我也是剛剛開始學(xué)習(xí),上面的分析不一定正確,也不一定全面。大家可以在我的主頁發(fā)郵件留言與我交流。
相關(guān)文章
php提示Failed to write session data錯誤的解決方法
這篇文章主要介紹了php提示Failed to write session data錯誤的解決方法,較為詳細的分析了session寫入錯誤的原因與解決方法,并附帶說明了php的工作機制,非常具有實用價值,需要的朋友可以參考下2014-12-12PHP 雜談《重構(gòu)-改善既有代碼的設(shè)計》之二 對象之間搬移特性
承接上文PHP 雜談《重構(gòu)-改善既有代碼的設(shè)計》之 重新組織你的函數(shù) ,繼續(xù)說重構(gòu)方面的內(nèi)容2012-04-04php使用str_replace替換多維數(shù)組的實現(xiàn)方法分析
這篇文章主要介紹了php使用str_replace替換多維數(shù)組的實現(xiàn)方法,結(jié)合具體實例對比分析了php針對多維數(shù)組的遍歷與替換操作相關(guān)實現(xiàn)技巧與注意事項,需要的朋友可以參考下2017-06-06php+mysql實現(xiàn)的二級聯(lián)動菜單效果詳解
這篇文章主要介紹了php+mysql實現(xiàn)的二級聯(lián)動菜單效果,涉及php操作mysql的連接、查詢結(jié)合javascript的DOM節(jié)點操作實現(xiàn)二級聯(lián)動菜單效果,末尾還附帶了mysql數(shù)據(jù)庫相應(yīng)的sql語句,需要的朋友可以參考下2016-05-05php性能優(yōu)化分析工具XDebug 大型網(wǎng)站調(diào)試工具
大型網(wǎng)站調(diào)試工具之一(php性能優(yōu)化分析工具XDebug) ,開發(fā)php的朋友可以參考下。有助于解決php代碼的多種問題。2011-05-05約瑟夫環(huán)問題的PHP實現(xiàn) 使用PHP數(shù)組內(nèi)部指針操作函數(shù)
約瑟夫環(huán)問題相信大家都已經(jīng)很熟悉了,一直想使用 PHP 來實現(xiàn)一下,琢磨了老半天的時間終于弄出來了,也許沒有網(wǎng)上的一些代碼實現(xiàn)的簡潔高效,但是畢竟是寫出來了~呵呵。2010-10-10