php用正則表達(dá)式匹配URL的簡單方法
在PHP的官網(wǎng)上看到的parse_url()函數(shù)的替代方案。結(jié)果和parse_url()函數(shù)差不多,是使用正則實(shí)現(xiàn)的。URI 是 Web上可用的每種資源 - HTML文檔、圖像、視頻片段、程序等 - 由一個通用資源標(biāo)志符(Uniform Resource Identifier, 簡稱"URI")進(jìn)行定位。 對象分組:
^(([^:/?#]+):)?(//([^/?#]*))?([^?#]*)(\?([^#]*))?(#(.*))?
12 3 4
測試代碼如下:
<?php
$search = '~^(([^:/?#]+):)?(//([^/?#]*))?([^?#]*)(\?([^#]*))?(#(.*))?~i';
$url = 'http://www.dbjr.com.cn/pub/ietf/uri/#Gonn';
$url = trim($url);
preg_match_all($search, $url ,$rr);
printf("<p>輸出URL數(shù)據(jù)為:</p><pre>%s</pre>\n",var_export( $rr ,TRUE));
/*
各分組如下
$1 = http:
$2 = http
$3 = //www.nowamagic.net
$4 = www.nowamagic.net
$5 = /pub/ietf/uri/
$6 = <undefined>
$7 = <undefined>
$8 = #Gonn
$9 = Gonn
*/
?>
上面的正則表達(dá)式可以獲取URL中的任何一部分,下面的代碼則簡單一些:
<?php
// 從 URL 中取得主機(jī)名
preg_match("/^(http:\/\/)?([^\/]+)/i", "http://www.dbjr.com.cn/index.html", $matches);
$host = $matches[2];
// 從主機(jī)名中取得后面兩段
preg_match("/[^\.\/]+\.[^\.\/]+$/", $host, $matches);
echo "domain name is: {$matches[0]}\n";
?>
相關(guān)文章
php實(shí)現(xiàn)數(shù)組重復(fù)數(shù)字統(tǒng)計(jì)實(shí)例
在本篇文章里我們給大家?guī)硪粋€關(guān)于php實(shí)現(xiàn)數(shù)組重復(fù)數(shù)字統(tǒng)計(jì)的實(shí)例,有用到的朋友們參考下。2018-09-09PHP安裝threads多線程擴(kuò)展基礎(chǔ)教程
php5.3或以上,且為線程安全版本。apache和php使用的編譯器必須一致,通過phpinfo()查看Thread Safety為enabled則為線程安全版,通過phpinfo()查看Compiler項(xiàng)可以知道使用的編譯器,本文給大家介紹PHP安裝threads多線程擴(kuò)展基礎(chǔ)教程,需要的朋友參考下2015-11-11基于curl數(shù)據(jù)采集之單頁面采集函數(shù)get_html的使用
在做數(shù)據(jù)采集時經(jīng)常要使用到curl+正則的方式采集需要的數(shù)據(jù) 根據(jù)自己的工作經(jīng)驗(yàn) 把自己寫的一些常用自定義函數(shù) 與大家來分享 如果有寫得不恰當(dāng)?shù)牡胤?請多多指教2013-04-04Base64在線編碼解碼實(shí)現(xiàn)代碼 演示與下載
最近遇到的幾個程序的加密方式都是Base64加密,很是暈菜,臨時整了個在線轉(zhuǎn)換,但是也不全部能搞定,呵呵也許還有不行的,希望對后來人有所幫助。2011-01-01thinkphp5引入公共部分header、footer的方法詳解
小編做的項(xiàng)目需要在項(xiàng)目中需要用到引入公共導(dǎo)航、頭部、底部、右邊部分等等,接下來通過本文給大家介紹thinkphp5引入公共部分header、footer的方法 ,需要的朋友可以參考下2018-09-09php實(shí)現(xiàn)cc攻擊防御和防止快速刷新頁面示例
這篇文章主要介紹了php實(shí)現(xiàn)cc攻擊防御的方法和防止快速刷新頁面示例,需要的朋友可以參考下2014-02-02