欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

linux 正則表達式grep實例分析

 更新時間:2020年04月12日 13:44:05   作者:cherrydreamsover  
正則表達式(Regular Expression)是用于描述一組字符串特征的模式,用來匹配特定的字符串。通過特殊字符+普通字符來進行模式描述,從而達到文本匹配目的工具

在很多技術(shù)領(lǐng)域(如:自然語言處理,數(shù)據(jù)存儲等),正則表達式可以很方便的提取我們想要的信息,所以正則表達式是一個很重要的知識點!

一、概念

正則表達式(Regular Expression)是用于描述一組字符串特征的模式,用來匹配特定的字符串。通過特殊字符+普通字符來進行模式描述,從而達到文本匹配目的工具。

正則表達式目前被集成到了各種文本編輯器/文本處理工具當(dāng)中

二、應(yīng)用場景

(1)驗證:表單提交時,進行用戶名密碼的驗證。

(2)查找:從大量信息中快速提取指定內(nèi)容,在一批url中,查找指定url。

(3)替換:將指定格式的文本進行正則匹配查找,找到之后進行特定替換。

三、基本要素

(1)字符類

(2)數(shù)量限定符

(3)位置限定符

(4)特殊符號

注意:正則表達式基本是與語言無關(guān)的,我們可以結(jié)合語言/工具與正則表達式進行文本處理,在后面的博客中,我將使用grep來進行驗證。(grep是一款Linux下按行匹配文本的工具,如下,使我們常使用的兩個選項)

-E:使用擴展正則匹配

--color:將匹配得到的內(nèi)容進行語法高亮

1.字符類


舉例如下:

例1:


注意:1.grep采用的貪心匹配,它會匹配當(dāng)前行中的所有匹配內(nèi)容

2.echo $?表示是否匹配成功(如果成功返回值為0,不成功返回值為1)

例2:


例3:


例4:


例5:


2.數(shù)量限定符


舉例如下:

例1:


例2:


由此,我們可以看出,“前面的單元”默認(rèn)是指?或+前面的字符

例3:


例4:


例5:


例6:


注意:該結(jié)果為匹配失敗,在相關(guān)文檔中并未出現(xiàn),應(yīng)該啊是錯誤或者廢棄的用法

例7:


3.位置限定符


舉例如下:

例1:


例2:


例3:


例4:


例5:


例6:


4.特殊符號


舉例如下:


假如我們?nèi)サ?E選項,會有什么現(xiàn)象呢?


此時,不難發(fā)現(xiàn),去掉-E選項之后沒有進行正常的正則匹配,這種現(xiàn)象需要我們引入如下的兩個概念!

5.基本正則表達式&擴展正則表達式

區(qū)別:正則表達式的擴展正則(Extended規(guī)范)和基本正則(Basic規(guī)范)下,有些字符應(yīng)該解釋為普通字符,要表示上述特殊含義則需要加“\”轉(zhuǎn)義字符。反之,在擴展規(guī)范下,應(yīng)被理解為特殊含義,要取其字面值,也要對其進行“\”轉(zhuǎn)義。

因此,grep工具帶上-E選項,表示使用擴展正則來進行匹配,若沒有該選項,則表示使用基準(zhǔn)正則來進行匹配。

對于上述的問題,我們舉例如下:

例1:


例2:當(dāng)目標(biāo)字符串當(dāng)中本身就包含了字符,要想進行正則匹配,應(yīng)該這樣做:


例3:


5.其他普通字符集及其替換


舉個例子:


綜上,正則表達式有以下三個分類:

(1)基本正則表達式:Basic即BPEs

(2)擴展正則表達式:Extended即EREs

(3)Perl的正則表達式:PREs

因此,當(dāng)grep指令不跟任何參數(shù)時,表示要使用BREs,后面跟“-E”表示使用EREs,后面跟“-P”參數(shù),表示使用PREs

四、貪婪模式與非貪婪模式

1.貪婪模式:正則表達式匹配時,會盡量多的匹配符合條件的內(nèi)容

舉例如下:


注意:grep默認(rèn)采用貪婪匹配,可能會對我們的測試結(jié)果造成干擾,大家可以上網(wǎng)使用“正則在線轉(zhuǎn)換工具”進行測試

2.非貪婪模式:正則表達式匹配時,會盡量少的匹配符合條件的內(nèi)容,也就是說,一旦發(fā)現(xiàn)匹配符合要求,立馬就匹配成功,而不會繼續(xù)匹配下去(除非有g(shù),開啟下一組匹配)

舉例如下:


五、零寬斷言

1.所謂斷言,是用來聲明一個應(yīng)該為真的事實。在正則表達式中,只有當(dāng)斷言為真時才會繼續(xù)進行匹配。

2.零寬斷言:像用于查找某些內(nèi)容之前或者之后的東西,其中一些特殊字符如“\b、^、$”等用于指定一個位置,這個位置應(yīng)滿足一定的條件。

3.分類:

(1)零寬度正預(yù)測先行斷言(?=exp)

它斷言自身出現(xiàn)的位置之后能匹配的表達式exp。如:\b\w+(?=ing\b),表示匹配以ing結(jié)尾的單詞的前面的部分(除ing以外的部分)。當(dāng)我們要查找“I'm singing while you're dancing.”時,它會匹配sing和danc

舉例如下:


(2)零寬度正回顧后發(fā)斷言(?>=exp)

它斷言自身出現(xiàn)的位置的前面能匹配的表達式exp。如:(?<=\bre)\w+\b會匹配以re開頭的單詞的后半部分(除er以外的部分),例如:在查找“reading a book”時,它匹配ading

舉例如下:


六、簡單練習(xí)

1.手機號碼


2.非零的正整數(shù)


3.非零開頭的最多帶兩位小數(shù)的數(shù)字


4.由數(shù)字和26位字母組成的字符串


5.QQ號,從10000開始


6.IP地址

\d+\.\d+\.\d+\.\d+

7.判斷賬號是否合法

^[a-zA-Z0-9][a-zA-Z0-9_]{4,15}$

8.日期格式

^\d{4}-\d{1,2}-\d{1,2}

正則表達式的學(xué)習(xí)就到這里結(jié)束啦,如果有小伙伴沒有看明白的,可以上網(wǎng)查詢正則的更多知識點!

相關(guān)文章

  • 簡單高效有用的正則表達式

    簡單高效有用的正則表達式

    正則表達式是一組由字母和符號組成的特殊文本,它可以用來從文本中找出滿足你想要的格式的句子,這里為大家分享如何編寫簡單高效有用的正則表達式,需要的朋友可以參考下
    2020-02-02
  • 正則的幾個基本概念

    正則的幾個基本概念

    正則的幾個基本概念...
    2006-11-11
  • JS驗證URL函數(shù) 正則

    JS驗證URL函數(shù) 正則

    搜集一個JS驗證URL函數(shù),方便需要的朋友
    2012-10-10
  • 正則表達式(regex)簡介和基本用法小結(jié)

    正則表達式(regex)簡介和基本用法小結(jié)

    正則表達式 (regex) 是用于模式匹配和文本操作的強大工具, 它們廣泛應(yīng)用于編程、文本處理、數(shù)據(jù)驗證等領(lǐng)域,這篇文章主要介紹了正則表達式 (regex) 簡介和基本用法,需要的朋友可以參考下
    2024-04-04
  • 詳解基于Linux下正則表達式(基本正則和擴展正則命令使用實例)

    詳解基于Linux下正則表達式(基本正則和擴展正則命令使用實例)

    正則表達式應(yīng)用廣泛,在絕大多數(shù)的編程語言都可以完美應(yīng)用,在Linux中,也有著極大的用處。 有興趣的可以了解一下。
    2017-01-01
  • 實用正則表達式匹配和替換大全

    實用正則表達式匹配和替換大全

    正則表達式非常有用,查找、匹配、處理字符串、替換和轉(zhuǎn)換字符串,輸入輸出等。而且各種語言都支持,具有一定的參考價值,感興趣的小伙伴們可以參考一下。
    2016-11-11
  • C# 正則表達式 使用介紹

    C# 正則表達式 使用介紹

    最近寫爬蟲時需要用到正則表達式,有段時間沒有使用正則表達式現(xiàn)在漸漸感覺有些淡忘,現(xiàn)在使用還需要去查詢一些資料
    2006-07-07
  • 去除內(nèi)容中的html

    去除內(nèi)容中的html

    去除內(nèi)容中的html...
    2006-06-06
  • 正則表達式預(yù)查的詳細(xì)解釋與應(yīng)用實例

    正則表達式預(yù)查的詳細(xì)解釋與應(yīng)用實例

    這幾天在用正則表達式做一個小程序,需要替換內(nèi)容中的某些特殊字符串。這些字符串的出現(xiàn)是有規(guī)律的,那就是在它左面總會特定的內(nèi)容出現(xiàn),右面卻沒有,下面這篇文章主要給大家介紹了關(guān)于正則表達式預(yù)查的詳細(xì)解釋與應(yīng)用實例,需要的朋友可以參考下
    2022-09-09
  • asp去除html標(biāo)記與空格的正則

    asp去除html標(biāo)記與空格的正則

    用asp實現(xiàn)的去除內(nèi)容的html標(biāo)記和空格的實現(xiàn)代碼
    2008-04-04

最新評論