解讀C++11 原生字符串
1.基本概念與作用
原生字符串(Raw String)指不進行轉(zhuǎn)義“所見即所得”的字符串。很多編程語言早已支持原生字符串,如C#、Python、Shell等。C++作為一門高級程序設(shè)計語言,自然不能自甘落后,從C++11開始,C++也開始支持原生字符串。
很多時候,當我們需要一行字符串的時候,字符串轉(zhuǎn)義往往成了一個負擔,寫和讀都帶了很大的不便。例如,對于如下路徑”D:\workdataDJ\code\vas_pgg_proj”,我們必須通過反斜杠進行轉(zhuǎn)義,把它寫成如下形式:
string path = "D:\\workdataDJ\\code\\vas_pgg_proj";
可能你會說這個并沒有多大影響,但當我們使用正則表達式時,由于正則表達式中特殊字符(如反斜杠、雙引號等)較多,再使用反斜杠進行轉(zhuǎn)義,那么正則表達式的可讀性將變得很差,形如下面的一條正則表達式
string re = "('(?:[^\\\\']|\\\\.)*'|\"(?:[^\\\\\"]|\\\\.)*\")|";
在C#中,我們可以通過@關(guān)鍵字來取消字符串轉(zhuǎn)義。在C++ 11中,它的非轉(zhuǎn)義形式為:
string path = R"(D:\workdataDJ\code\vas_pgg_proj)";
從上面的例子中可以看出,C++的語法格式如下:
(1)字符串前加R前綴;
(2)字符串首尾加上小括號;
它的語法格式比C#的@前綴要稍微復(fù)雜點,不過這個復(fù)雜也有復(fù)雜的好處,那就是字符串里面可以帶雙引號。
string path = R"(this "word" is escaped)";
而C#就無法保持原始字符串格式,對雙引號仍需要轉(zhuǎn)義:
string path = @"this ""word"" is escaped";
2.原生字符串與Unicode字符串結(jié)合
由于C++11對Unicode的支持,原生字符串的定義方式可以與Unicode字符串結(jié)合使用,定義UTF-8、UTF-16和UTF-32的原生字符串,將其前綴分別設(shè)置為u8R、uR和UR即可。有一點需要注意,使用了原生字符串,轉(zhuǎn)義字符就不能再使用了,這會給使用\u或者\U的方式書寫Unicode字符的程序帶來一定影響。參看下面的例子。
#include <iostream> using namespace std; int main() { cout<<u8R"(\u4F60,\n \u597D)"<<endl; cout << u8R"(你好)" << endl; cout << sizeof(u8R"(hello)") << "\t" << u8R"(hello)" << endl; cout << sizeof(uR"(hello)") << "\t" << uR"(hello)" << endl; cout << sizeof(UR"(hello)") << "\t" << UR"(hello)" << endl; }
程序輸出結(jié)果:
\u4F60,\n
\u597D
你好
6 hello
12 00C03174
24 00C03180
從結(jié)果可以看出,使用\u定義Unicode字符時,未能如果異常,輸出原生字符串的模樣。在使用sizeof運算符計算不同編碼的相同字符串時,得到的結(jié)果是不通的,大小跟其申明的類型是完全一致的。注意在使用cout對UTF-16和UTF-8編碼的字符串進行輸出時,輸出的是字符串地址。
3.原生字符串的連接
C++中同樣可以將原生字符串進行連接,但不要將不同編碼的字符串進行連接,因為C++尚不支持這種做法??疾烊缦麓a:
#include <iostream> using namespace std; int main() { char string[] = R"(你好)"R"(=hello)"; char u8u8string[] = u8R"(你好)"u8R"(=hello)"; //char u8ustring[] = u8R"(你好)"uR"=hello"; //編譯報錯 cout << string<< endl; cout << u8string << endl; cout << sizeof(string) << endl; cout << sizeof(u8u8string) << endl; return 0; } //程序編譯選項:g++ -finput-charset=utf-8 test.cpp
代碼輸出結(jié)果如下:
你好=hello
你好=hello
13
13
可以看出,原生字符串會被編譯器自動連接在一起,整個字符串“你好=hello”含有兩個UTF-8編碼的中文字符,共占6字節(jié),和6個ASCII字符,再加上自動生成的空字符\0,字符串共占用13字節(jié)空間。UTF-8與UTF-16兩種不同編碼的字符在連接時,編譯報錯,C++目前還不支持這種寫法,請避免。
以上就是解讀C++11 原生字符串的詳細內(nèi)容,更多關(guān)于C++11 原生字符串的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
OpenCV實現(xiàn)簡單攝像頭視頻監(jiān)控程序
這篇文章主要為大家詳細介紹了OpenCV實現(xiàn)簡單攝像頭視頻監(jiān)控程序,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2019-08-08C++ 冒泡排序數(shù)據(jù)結(jié)構(gòu)、算法及改進算法
冒泡排序是一種簡單排序。這種排序是采用“冒泡策略”將最大元素移到最右邊。在冒泡過程中,相鄰兩個元素比較,如果左邊大于右邊的,則進行交換兩個元素。這樣一次冒泡后,可確保最大的在最右邊。然后執(zhí)行n次冒泡后排序即可完畢2013-04-04C數(shù)據(jù)結(jié)構(gòu)之雙鏈表詳細示例分析
以下是對c語言中的雙鏈表進行了詳細的分析介紹,需要的朋友可以過來參考下2013-08-08