解讀C++11 原生字符串
1.基本概念與作用
原生字符串(Raw String)指不進(jìn)行轉(zhuǎn)義“所見即所得”的字符串。很多編程語言早已支持原生字符串,如C#、Python、Shell等。C++作為一門高級(jí)程序設(shè)計(jì)語言,自然不能自甘落后,從C++11開始,C++也開始支持原生字符串。
很多時(shí)候,當(dāng)我們需要一行字符串的時(shí)候,字符串轉(zhuǎn)義往往成了一個(gè)負(fù)擔(dān),寫和讀都帶了很大的不便。例如,對(duì)于如下路徑”D:\workdataDJ\code\vas_pgg_proj”,我們必須通過反斜杠進(jìn)行轉(zhuǎn)義,把它寫成如下形式:
string path = "D:\\workdataDJ\\code\\vas_pgg_proj";
可能你會(huì)說這個(gè)并沒有多大影響,但當(dāng)我們使用正則表達(dá)式時(shí),由于正則表達(dá)式中特殊字符(如反斜杠、雙引號(hào)等)較多,再使用反斜杠進(jìn)行轉(zhuǎn)義,那么正則表達(dá)式的可讀性將變得很差,形如下面的一條正則表達(dá)式
string re = "('(?:[^\\\\']|\\\\.)*'|\"(?:[^\\\\\"]|\\\\.)*\")|";
在C#中,我們可以通過@關(guān)鍵字來取消字符串轉(zhuǎn)義。在C++ 11中,它的非轉(zhuǎn)義形式為:
string path = R"(D:\workdataDJ\code\vas_pgg_proj)";
從上面的例子中可以看出,C++的語法格式如下:
(1)字符串前加R前綴;
(2)字符串首尾加上小括號(hào);
它的語法格式比C#的@前綴要稍微復(fù)雜點(diǎn),不過這個(gè)復(fù)雜也有復(fù)雜的好處,那就是字符串里面可以帶雙引號(hào)。
string path = R"(this "word" is escaped)";
而C#就無法保持原始字符串格式,對(duì)雙引號(hào)仍需要轉(zhuǎn)義:
string path = @"this ""word"" is escaped";
2.原生字符串與Unicode字符串結(jié)合
由于C++11對(duì)Unicode的支持,原生字符串的定義方式可以與Unicode字符串結(jié)合使用,定義UTF-8、UTF-16和UTF-32的原生字符串,將其前綴分別設(shè)置為u8R、uR和UR即可。有一點(diǎn)需要注意,使用了原生字符串,轉(zhuǎn)義字符就不能再使用了,這會(huì)給使用\u或者\(yùn)U的方式書寫Unicode字符的程序帶來一定影響。參看下面的例子。
#include <iostream> using namespace std; int main() { cout<<u8R"(\u4F60,\n \u597D)"<<endl; cout << u8R"(你好)" << endl; cout << sizeof(u8R"(hello)") << "\t" << u8R"(hello)" << endl; cout << sizeof(uR"(hello)") << "\t" << uR"(hello)" << endl; cout << sizeof(UR"(hello)") << "\t" << UR"(hello)" << endl; }
程序輸出結(jié)果:
\u4F60,\n
\u597D
你好
6 hello
12 00C03174
24 00C03180
從結(jié)果可以看出,使用\u定義Unicode字符時(shí),未能如果異常,輸出原生字符串的模樣。在使用sizeof運(yùn)算符計(jì)算不同編碼的相同字符串時(shí),得到的結(jié)果是不通的,大小跟其申明的類型是完全一致的。注意在使用cout對(duì)UTF-16和UTF-8編碼的字符串進(jìn)行輸出時(shí),輸出的是字符串地址。
3.原生字符串的連接
C++中同樣可以將原生字符串進(jìn)行連接,但不要將不同編碼的字符串進(jìn)行連接,因?yàn)镃++尚不支持這種做法??疾烊缦麓a:
#include <iostream> using namespace std; int main() { char string[] = R"(你好)"R"(=hello)"; char u8u8string[] = u8R"(你好)"u8R"(=hello)"; //char u8ustring[] = u8R"(你好)"uR"=hello"; //編譯報(bào)錯(cuò) cout << string<< endl; cout << u8string << endl; cout << sizeof(string) << endl; cout << sizeof(u8u8string) << endl; return 0; } //程序編譯選項(xiàng):g++ -finput-charset=utf-8 test.cpp
代碼輸出結(jié)果如下:
你好=hello
你好=hello
13
13
可以看出,原生字符串會(huì)被編譯器自動(dòng)連接在一起,整個(gè)字符串“你好=hello”含有兩個(gè)UTF-8編碼的中文字符,共占6字節(jié),和6個(gè)ASCII字符,再加上自動(dòng)生成的空字符\0,字符串共占用13字節(jié)空間。UTF-8與UTF-16兩種不同編碼的字符在連接時(shí),編譯報(bào)錯(cuò),C++目前還不支持這種寫法,請(qǐng)避免。
以上就是解讀C++11 原生字符串的詳細(xì)內(nèi)容,更多關(guān)于C++11 原生字符串的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
C++使用智能指針實(shí)現(xiàn)模板形式的單例類
這篇文章主要為大家詳細(xì)介紹了C++使用了智能指針實(shí)現(xiàn)模板形式的單例類,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-06-06OpenCV實(shí)現(xiàn)簡(jiǎn)單攝像頭視頻監(jiān)控程序
這篇文章主要為大家詳細(xì)介紹了OpenCV實(shí)現(xiàn)簡(jiǎn)單攝像頭視頻監(jiān)控程序,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-08-08c++ priority_queue用法入門超詳細(xì)教程
priority_queue即優(yōu)先級(jí)隊(duì)列,它的使用場(chǎng)景很多,它底層是用大小根堆實(shí)現(xiàn)的,可以用log(n)的時(shí)間動(dòng)態(tài)地維護(hù)數(shù)據(jù)的有序性,這篇文章主要介紹了c++ priority_queue用法入門超詳細(xì)教程,需要的朋友可以參考下2023-12-12基于C語言實(shí)現(xiàn)簡(jiǎn)易三子棋游戲
這篇文章主要為大家詳細(xì)介紹了基于C語言實(shí)現(xiàn)簡(jiǎn)易三子棋游戲,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下<BR>2022-01-01C++ 冒泡排序數(shù)據(jù)結(jié)構(gòu)、算法及改進(jìn)算法
冒泡排序是一種簡(jiǎn)單排序。這種排序是采用“冒泡策略”將最大元素移到最右邊。在冒泡過程中,相鄰兩個(gè)元素比較,如果左邊大于右邊的,則進(jìn)行交換兩個(gè)元素。這樣一次冒泡后,可確保最大的在最右邊。然后執(zhí)行n次冒泡后排序即可完畢2013-04-04C語言實(shí)現(xiàn)電話訂餐管理系統(tǒng)
這篇文章主要為大家詳細(xì)介紹了C語言實(shí)現(xiàn)電話訂餐管理系統(tǒng),文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-01-01C數(shù)據(jù)結(jié)構(gòu)之雙鏈表詳細(xì)示例分析
以下是對(duì)c語言中的雙鏈表進(jìn)行了詳細(xì)的分析介紹,需要的朋友可以過來參考下2013-08-08