c++11中regex正則表達式示例簡述
regex庫中涉及到的主要類型有:
- 以std::string為代表的處理字符串的類型(我們知道還有存儲wchar_t的wstring類、原生c式字符串const char*等等,為了簡化處理僅介紹std::string類型相關的操作,當你把握住了regex的主脈絡之后,想使用其他的版本只要類比就可以)
- std::regex類,該類型需要一個代表正則表達式的字符串和一個文法選項作為輸入,當文法選項不提供時默認為ECMAScript。
- std::match_results類,該類用來記錄匹配的結果,這是一個模板類,該類的模板參數(shù)是一個迭代器類型,對于std::string來說我們定義了smatch作為match_results<string::const_iterator>作為別名。
- std::sub_match類,該類其實封裝了兩個迭代器,第一個代表開始部分,第二個代表結束部分,就像你用兩個下表索引去表達一個字符串的某一個子串一樣。這個類就是通過這樣的方式提供原字符串的某一個子串作為結果。實際上match_results中就封裝了一些std::sub_match類型的對象。(為什么是一些而不是一個,因為一次匹配可能會產(chǎn)生多個結果返回,regex認為每個括號對構成一個子匹配項,regex匹配的結果可以顯式每個子匹配項匹配到的內(nèi)容。)
- 現(xiàn)在我們有了表達字符串的類,表達正則匹配的類,表達匹配結果的類,接下來regex提供三個匹配函數(shù):
bool std::regex_match(...) bool std::regex_search(...) string std::regex_replace(...)//實際上返回類型是根據(jù)你輸入的數(shù)據(jù)類型對應的basic_string類。
首先說明三個函數(shù)功能上的不同,std::regex_match是全文匹配,即它希望你輸入的字符串要和正則表達式全部匹配,才認為匹配成功,否則匹配失敗,而std::regex_search是在你輸入的字符串中不斷搜索符合正則表達式描述的子字符串,然后將第一個匹配到的子字符串返回。std::regex_replace是在std::regex_search的基礎上更進一步,可以將匹配的子字符串替換為你提供的字符串。
看幾個例子:
#include <iostream> #include <string> #include <regex> int main() { std::regex pattern("\\d{4}"); std::string content("hello_2018"); std::smatch result; if (std::regex_match(content, result, pattern)) { std::cout << result[0]; } system("pause"); return 0; }
匹配失敗,什么都不會輸出。
這里說明一下為什么輸出的是result[0],其實result[0]返回的就是一個sub_match類型的對象。regex中認為正則表達式的每個括號對構成一個子匹配項,并認為整個字符串作為0號子匹配項,然后根據(jù)左括號出現(xiàn)的位置,從1號開始編號,因此返回的result[0]就是匹配整個正則表達式的字符串。
#include <iostream> #include <string> #include <regex> int main() { std::regex pattern("\\d{4}"); std::string content("hello_2018 by_2017"); std::smatch result; if (std::regex_search(content, result, pattern)) { std::cout << result[0]; } system("pause"); return 0; }
搜索到第一個符合正則表達式的子串,輸出 2018。
#include <iostream> #include <string> #include <regex> int main() { std::regex pattern("\\d{4}"); std::string content("hello_2018 by_2017"); std::smatch result; auto begin = content.cbegin(); auto end = content.cend(); while (std::regex_search(begin, end, result, pattern)) { std::cout << result[0] << " "; begin = result[0].second; } system("pause"); return 0; }
用上述方式可以輸出字符串中所有符合正則表達式匹配要求的字符串,輸出 2018 2017。
#include <iostream> #include <string> #include <regex> int main() { std::regex pattern("\\d{4}"); std::string content("hello_2018 by_2017"); std::string result = std::regex_replace(content, pattern, "everyone"); std::cout << result; system("pause"); return 0; }
輸出 hello_everyone by_everyone。
以上就是c++11提供的regex模塊的主要脈絡,其余的關于對const char* 、wcahr_t類型的支持,以及regex_iterator、regex_token_iterator等迭代器的使用,以及掌控正則表達式行為方式的syntax_option_type的詳細內(nèi)容,等你需要去了解的時候去看官網(wǎng)的詳解,相信學起來并不難。
總結
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對腳本之家的支持。
相關文章
Matlab利用隨機森林(RF)算法實現(xiàn)回歸預測詳解
這篇文章主要為大家詳細介紹了Matlab如何利用隨機森林(RF)算法實現(xiàn)回歸預測,以及自變量重要性排序的操作,感興趣的小伙伴可以了解一下2023-02-02