遭遇php的in_array低性能問題
PHP的性能一直在提高。然而,若是用的不恰當(dāng),或是一個不留神,還是可能會踩到PHP內(nèi)部實現(xiàn)方面的坑的。我在前幾天的一個性能問題上就碰到了。
事情是這樣子的,一位同事反饋我們的一個接口每次返回需要5秒之久,我們一起review了代碼,“驚喜”的發(fā)現(xiàn)居然在循環(huán)(大約900次)中調(diào)用了一個讀緩存的操作,而這個緩存的key并沒有改變,因此我們把這段代碼移到了循環(huán)外面,再測,接口返回時間降到了2秒,嗚呼!雖然提升了1倍,但明顯不是我們能接受的結(jié)果!
出現(xiàn)性能問題的代碼量并不大,我們排除了IO問題以后,寫了一段測試代碼,果然問題很快重現(xiàn)。
<?php
$y="1800";
$x = array();
for($j=0;$j<2000;$j++){
$x[]= "{$j}";
}
for($i=0;$i<3000;$i++){
if(in_array($y,$x)){
continue;
}
}
?>
shell$ time /usr/local/php/bin/php test.php
real 0m1.132s
user 0m1.118s
sys 0m0.015s
對的,我們用的就是字符串型的數(shù)字,從緩存拿出來就是這樣子的啦!所以這里是特意轉(zhuǎn)成字符串的(如果直接是數(shù)字,并不會出現(xiàn)這個問題 ,各位可以自行驗證)??梢钥闯鰰r間耗掉了1秒,才3000次循環(huán),后面的sys用時也注定我們用strace不會拿到什么有效信息。
shell$ strace -ttt -o xxx /usr/local/php/bin/php test.php
shell$ less xxx

我們只看到這兩次系統(tǒng)調(diào)用之間的延時非常大,卻并不知道干了什么?一籌莫展了,幸好,Linux下的調(diào)試?yán)鞒藄trace還有l(wèi)trace(當(dāng)然還有dtrace,ptrace,不在本文討論范圍了,略去)。
引用:strace用來 跟蹤一個進程的系統(tǒng)調(diào)用或信號產(chǎn)生的情況,而 ltrace用來 跟蹤進程調(diào)用庫函數(shù)的情況(via IBM developerworks)。
為了排除干擾因素,我們將$x直接賦值為array(“0″,”1″,”2″,……)的形式,避免過多的malloc調(diào)用影響結(jié)果。執(zhí)行
shell$ ltrace -c /usr/local/php/bin/php test.php
如圖2

我們看到庫函數(shù)__strtol_internal的調(diào)用非常之頻繁,達到了94%,太夸張了,然后我又查了一下這個庫函數(shù)__strtol_internal是干嘛的,原來是strtol的別名,簡單的說就是把字符串轉(zhuǎn)換成長整形,可以猜測PHP引擎已經(jīng)檢測到這是一個字符串型的數(shù)字,所以期望將他們轉(zhuǎn)換成長整型來比較,這個轉(zhuǎn)換過程中消耗了太多時間,我們再次執(zhí)行:
shell$ ltrace -e "__strtol_internal" /usr/local/php/bin/php test.php
可以輕松抓到大量下圖這樣的調(diào)用,到此,問題找到了,in_array這種松比較,會將兩個字符型數(shù)字串先轉(zhuǎn)換為長整型再進行比較,卻不知性能就耗在這上面了。

知道了癥結(jié)所在,我們解決的辦法就很多了,最簡單的就是為in_array加第三個參數(shù)為true,即變?yōu)閲?yán)格比較,同時還要比較類型,這樣避免了PHP自作聰明的轉(zhuǎn)換類型,跑起來果然快多了,代碼如下:
<?php
$y="1800";
$x = array();
for($j=0;$j<2000;$j++){
$x[]= "{$j}";
}
for($i=0;$i<3000;$i++){
if(in_array($y,$x,true)){
continue;
}
}
?>
shell$ time /usr/local/php/bin/php test.php
real 0m0.267s
user 0m0.247s
sys 0m0.020s
快了好多倍?。。?!可以看到sys耗時幾乎沒有太大變化。我們再次ltrace一把,還是要把$x直接賦值,排除malloc調(diào)用的干擾,因為我們實際應(yīng)用中是從緩存里一次拉出來的,所以也不存在示例代碼中這樣的循環(huán)來申請內(nèi)存的情況。
再次執(zhí)行
shell$ ltrace -c /usr/local/php/bin/php test.php
如下圖:
__ctype_tolower_loc占用了最多的時間!查了一下庫函數(shù)__ctype_tolower_loc是干嘛的:簡單的理解是將字符串轉(zhuǎn)換成小寫,那么這說明in_array比較字符串不區(qū)分大小寫嗎?其實這個函數(shù)調(diào)用已經(jīng)和我們這個in_array感覺聯(lián)系不大了,關(guān)于in_array的實現(xiàn),還是去看看PHP的源碼,大概理解的更為透徹了,好了,沒法往下說了,歡迎與我交流,寫的不對的地方請多多斧正。
———————2013.08.29分割線——————————
晚上又翻了以下PHP 5.4.10的源碼,對in_array的興趣真大啊,哈哈,位于./ext/standard/array.c的第1248行,可以看到他調(diào)用了php_search_array函數(shù),下面的array_serach也是調(diào)的這個,只是最后一個參數(shù)不同!經(jīng)過一番跟蹤,在in_array松比較的情況下,他最終調(diào)用的函數(shù) zendi_smart_strcmp(果然是個“聰明”函數(shù))進行比較,位于./Zend/zend_operators.c,我們用ltrace抓到的大量轉(zhuǎn)換成整型的操作就是那個is_numeric_string_ex的行為。
函數(shù)is_numeric_string_ex是在./Zend/zend_operators.h中定義的,在前面進行了一堆的判斷和轉(zhuǎn)換之后,在232行調(diào)用了strtol,就是我們在文章中提到的系統(tǒng)函數(shù)了,將字符串轉(zhuǎn)換成長整型,有圖有真相
- php數(shù)組函數(shù)序列之in_array() 查找數(shù)組值是否存在
- php數(shù)組查找函數(shù)in_array()、array_search()、array_key_exists()使用實例
- php in_array 函數(shù)使用說明與in_array需要注意的地方說明
- PHP函數(shù)in_array()使用詳解
- php數(shù)組函數(shù)序列之in_array() - 查找數(shù)組中是否存在指定值
- 2個自定義的PHP in_array 函數(shù),解決大量數(shù)據(jù)判斷in_array的效率問題
- 使用js判斷數(shù)組中是否包含某一元素(類似于php中的in_array())
- 類似php的js數(shù)組的in_array函數(shù)自定義方法
- PHP IN_ARRAY 函數(shù)使用注意事項
- PHP中in_array函數(shù)使用的問題與解決辦法
相關(guān)文章
php中突破基于HTTP_REFERER的防盜鏈措施(stream_context_create)
如果考慮突破防盜鏈的措施,就需要考慮在 HTTP_REFERER 上面做手腳了。很多網(wǎng)站是通過referer來判斷是否盜鏈。2011-03-03php基礎(chǔ)知識:類與對象(4) 范圍解析操作符(::)
php基礎(chǔ)知識:類與對象(4) 范圍解析操作符(::)...2006-12-12PHP vsprintf()函數(shù)格式化字符串操作原理解析
這篇文章主要介紹了PHP vsprintf()函數(shù)格式化字符串操作原理解析,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-07-07PHP以指定字段為索引返回數(shù)據(jù)庫所取的數(shù)據(jù)數(shù)組
本文與大家分享幾個使用得PHP編程技巧,有些技巧是在看別人代碼的時候?qū)W來的,有些是自己總結(jié)的,下面為大家介紹下以特定字段為索引,返回數(shù)據(jù)庫取的數(shù)據(jù)數(shù)組,感興趣的朋友可以了解下哈2013-06-06