php中去除所有js,html,css代碼
更新時間:2010年10月12日 22:12:50 作者:
php中去除所有js,html,css代碼,方便php的小偷采集程序的制作。
復制代碼 代碼如下:
<?php
$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
"'<style[^>]*?>.*?</style>'si", // 去掉 css
"'<[/!]*?[^<>]*?>'si", // 去掉 HTML 標記
"'<!--[/!]*?[^<>]*?>'si", // 去掉 注釋標記
"'([rn])[s]+'", // 去掉空白字符
"'&(quot|#34);'i", // 替換 HTML 實體
"'&(amp|#38);'i",
"'&(lt|#60);'i",
"'&(gt|#62);'i",
"'&(nbsp|#160);'i",
"'&(iexcl|#161);'i",
"'&(cent|#162);'i",
"'&(pound|#163);'i",
"'&(copy|#169);'i",
"'&#(d+);'e"); // 作為 PHP 代碼運行
$replace = array ("",
"",
"",
"",
"\1",
"\"",
"&",
"<",
">",
" ",
chr(161),
chr(162),
chr(163),
chr(169),
"chr(\1)");
//$document為需要處理字符串,如果來源為文件可以$document = file_get_contents('http://www.sina.com.cn');
$out = preg_replace($search, $replace, $document);
echo $out;
?>
存為get.php即可。
相關文章
PHP編碼規(guī)范-php coding standard
標準化問題在某些方面上讓每個人頭痛,讓人人都覺得大家處于同樣的境地。這有助于讓這些建議在許多的項目中不斷演進,許多公司花費了許多星期逐子字逐句的進行爭論。2007-03-03