C++char類型和輸入輸出優(yōu)化
1、char類型
char
的全稱是character
,也就是字符的意思。顧名思義,char
類型是專門為了存儲字符而設(shè)計的。
計算機(jī)存儲數(shù)字非常方便,只需要將其轉(zhuǎn)化成二進(jìn)制即可。但存儲字符就有點(diǎn)麻煩了,一般都是通過對字符進(jìn)行數(shù)字化編碼。這也就是為什么char類型本質(zhì)上是另外一種整數(shù),因?yàn)樗鎯Φ钠鋵?shí)是字符的數(shù)字編碼。
char
一共有8個二進(jìn)制位,即一個字節(jié),理論上能夠存儲256個字符。基本上足夠涵蓋計算機(jī)當(dāng)中所有的字母、標(biāo)點(diǎn)符號以及數(shù)字,即ASCII
碼。
ASCII的全稱是美國信息交換標(biāo)準(zhǔn)代碼,它是一套電腦編碼系統(tǒng),包含了所有英文字母以及標(biāo)點(diǎn)符號和一些特殊字符。全表一共有128個字符,剛好可以用一個char
(有符號)來存儲。
大家可以參考一下下表,Dec表示編號,Char
表示字符。
其中數(shù)字0的編號是48,字母a的編號是97,大寫字母A的標(biāo)號是65。
當(dāng)我們把一個字符賦值給char
型變量的時候,它會去查ASCII
表,找到字符對應(yīng)的編號。同樣,當(dāng)我們使用%c輸出一個字符的時候,它也會去尋找char
中存儲的編碼對應(yīng)的符號進(jìn)行輸出。
既然字符在C++
當(dāng)中都是以數(shù)字的形式存儲的,那么我們就可以對它來進(jìn)行加減運(yùn)算。
比如:
char c = 'a'; cout << ++c << endl;
得到的結(jié)果是'b',有加自然也有減,我們也可以對它做減法操作。
char c = 'b'; cout << --b << endl;
得到的結(jié)果就是'a'。
另外,我們還可以對于兩個char
類型的變量進(jìn)行減法操作。比如用得比較多的就是將字符型的數(shù)字轉(zhuǎn)成int型。
char c = '1'; int num = c - '0';
這樣我們得到的num
就是數(shù)字型的1。
再比如,我們還可以通過大于小于符號來判斷char類型的范圍:
char c = '1'; if (c >= '0' && c <= '9') { cout << "c is a number" << endl; }
2、getchar、putchar、cin.get、cout.put
getchar
和putchar
都是C語言當(dāng)中專門面向字符IO的函數(shù),也就是讀入和輸出字符的函數(shù)。
因?yàn)榇_定了處理的數(shù)據(jù)類型是字符,不需要額外的格式說明,因此getchar
和putchar
的效率要比scanf
和printf更高。
所以在算法競賽領(lǐng)域,有人為了提升程序的性能,喪心病狂地使用getchar
代替scanf
來讀入數(shù)據(jù)。
我這里貼一段使用getchar
來讀入int型的代碼,給大家做一個參考。這個屬于標(biāo)準(zhǔn)的奇淫技巧,不推薦使用。
void read(int &x) { int f = 1; x = 0; char s = getchar(); while (s < '0' || s > '9') { if (s == '-') { f = -1; s = getchar(); } } while (s >= '0' && s <= '9') { x = x * 10 + s - '0'; s = getchar(); } x *= f; }
cin.get
和cout.put
與getchar
和putchar
的用法類似,只不過是C++當(dāng)中的特性。大家可以參考一下下面這個例子,就不過多贅述了。
char c; cin.get(c); cout.put(c);
3、輸入輸出中文
關(guān)于這一段我猶豫了很久要不要加,因?yàn)閷?shí)在是沒有相關(guān)經(jīng)驗(yàn),畢竟之前只刷題了。糾結(jié)了很久還是決定寫上,因?yàn)檫@個問題對于不少同學(xué)應(yīng)該挺重要的,尤其是想要做C++工程的同學(xué)。本人水平有限,勉強(qiáng)整理了一下各方資料,如有錯誤,歡迎指出~
其實(shí)直接在C++當(dāng)中是可以直接輸出中文的,這并不會有什么問題。
比如下列代碼,是可以完美運(yùn)行的:
string str; cin >> str; cout << str << endl; cout << str.length() << endl;
只是為什么最后輸出的長度是6?因?yàn)槲沂窃?code>Mac上跑的這段代碼。在Mac
當(dāng)中默認(rèn)使用utf-8
編碼,一個漢字的長度是3個字節(jié)。C++當(dāng)中的字符串計算長度的時候統(tǒng)計的是字節(jié)的數(shù)量,所以兩個漢字的長度是6。
如果我們是在源代碼當(dāng)中寫入了中文,比如:
string str = "中文"; cout << str << endl;
這就可能一些問題,最常見的問題就是代碼存儲環(huán)境和運(yùn)行環(huán)境的默認(rèn)編碼不同,比如IDE當(dāng)中默認(rèn)是utf-8
編碼,但是終端默認(rèn)是gbk編碼(windows
系統(tǒng)常見)。這就會導(dǎo)致輸出的結(jié)果是亂碼。
解決方案是我們可以使用wchar_t,wchar_t
即char
的寬類型版本,它占據(jù)兩個字節(jié)??梢杂脕泶鎯?code>unicode編碼的字符:
const wchar_t* str = L"中文";
我們在中文兩個字之前加上了L修飾符,它告訴編譯器,這是一個寬字符,我們需要編譯器根據(jù)locale來進(jìn)行翻譯。
locale是指根據(jù)計算機(jī)用戶使用的語言、所在的國家或地區(qū)以及文化傳統(tǒng)而定義的軟件運(yùn)行時的語言環(huán)境??梢詫?code>locale理解為一系列環(huán)境變量。locale
環(huán)境變量值的格式為language_area.charset。languag
表示語言,例如英語或中文;area
表示使用該語言的地區(qū),例如美國或者中國大陸;charset表示字符集編碼,例如UTF-8
或者GBK
。
這些環(huán)境變量會對日期格式,數(shù)字格式,貨幣格式,字符處理等多個方面產(chǎn)生影響。在Linux
系統(tǒng)下打開Terminal
,輸入locale
命令,就可查看當(dāng)前系統(tǒng)使用的語言環(huán)境。
locale
的結(jié)果包含12類,我在網(wǎng)上也找到了表格:
LANG
指的是未設(shè)置的默認(rèn)值,大部分程序應(yīng)用LANGUAGE
指定的語言作為界面語言。LC_ALL
同時設(shè)置所有的內(nèi)容,并且其優(yōu)先級比每個內(nèi)容單獨(dú)設(shè)置的優(yōu)先級都高,而LANG
的優(yōu)先級最低。
cin
和cout
可以看成是針對char
的流,所以不適合應(yīng)用在wchar_t
類型的處理上。與之對應(yīng)我們應(yīng)該使用wcin和wcout
。而wcout
默認(rèn)采用的是C local
,并不認(rèn)識中文,所以我們要先對wcout
的local
進(jìn)行設(shè)置。將其設(shè)置成和運(yùn)行環(huán)境的local一致。
大約有以下幾種設(shè)置方法:
#include <codecvt> const wchar_t* str = L"中文"; // 使用默認(rèn)local locale loc(""); wcout.imbue(loc); // 使用local命令顯示的結(jié)果 locale loc("en_US.UTF-8"); wcout.imbue(loc); // 使用標(biāo)準(zhǔn)facet locale utf8(locale(), new codecvt_utf8_utf16<wchar_t> ); wcout.imbue(utf8); // 使用系統(tǒng)local locale sys_loc(""); wcout.imbue(sys_loc); wcout << str << endl; cout << wcslen(str) << endl;
我們可以使用wcslen
來計算寬字節(jié)字符串的長度,它輸出的結(jié)果是2,而不是6。
C++當(dāng)中的編碼設(shè)置是一個很大的問題,因?yàn)樵谒㈩}當(dāng)中幾乎不會遇到,我們這里也只是做一個淺嘗輒止的討論。大家如果有需要,可自行深入研究。
到此這篇關(guān)于C++char
類型和輸入輸出優(yōu)化的文章就介紹到這了,更多相關(guān)C++char
類型和輸入輸出優(yōu)化內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
注:文章轉(zhuǎn)自微信公眾號:Coder梁(ID:Coder_LT)
- C++char類型和輸入輸出優(yōu)化
- C++中char[]能修改char*卻不行
- C++中const char*、char const*、char * const三者的區(qū)別
- C++ WideCharToMultiByte()函數(shù)案例詳解
- C++中putchar與getchar函數(shù)的細(xì)節(jié)及運(yùn)用
- C++ 將字符串值賦給CHAR數(shù)組的實(shí)現(xiàn)
- C++中string轉(zhuǎn)換為char*類型返回后亂碼問題解決
- C++程序中main(int argc, char *argv[])函數(shù)的參數(shù)意義
- C++編程之CString、string與、char數(shù)組的轉(zhuǎn)換
相關(guān)文章
sqlserver,sqlite,access數(shù)據(jù)庫鏈接字符串整理
本節(jié)主要整理sqlserver,sqlite,access數(shù)據(jù)庫鏈接字符串,有需要的朋友可以參考下2014-07-07VScode搭建C/C++開發(fā)環(huán)境的詳細(xì)過程
最近迷上了vscode,小巧美觀,最主要的是全平臺,但是vscode并不是ide,必須得自己配置環(huán)境,下面這篇文章主要給大家介紹了關(guān)于VScode搭建C/C++開發(fā)環(huán)境的詳細(xì)過程,需要的朋友可以參考下2023-06-06Cocos2d-x UI開發(fā)之CCControlButton控件類實(shí)例
這篇文章主要介紹了Cocos2d-x UI開發(fā)之CCControlButton控件類實(shí)例,本文代碼中包含大量注釋來講解CCControlButton控件類的使用,需要的朋友可以參考下2014-09-09C語言超詳細(xì)講解數(shù)據(jù)結(jié)構(gòu)中雙向帶頭循環(huán)鏈表
帶頭雙向循環(huán)鏈表:結(jié)構(gòu)最復(fù)雜,一般用在單獨(dú)存儲數(shù)據(jù)。實(shí)際中使用的鏈表數(shù)據(jù)結(jié)構(gòu),都是帶頭雙向循環(huán)鏈表。另外這個結(jié)構(gòu)雖然結(jié)構(gòu)復(fù)雜,但是使用代碼實(shí)現(xiàn)以后會發(fā)現(xiàn)結(jié)構(gòu)會帶來很多優(yōu)勢,實(shí)現(xiàn)反而簡單2022-04-04Visual Studio Code上添加小程序自動補(bǔ)全插件的操作方法
這篇文章主要介紹了Visual Studio Code上添加小程序自動補(bǔ)全插件的操作方法,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-04-04Matlab實(shí)現(xiàn)繪制立體玫瑰花的示例代碼
這篇文章主要介紹了如何利用Matlab實(shí)現(xiàn)繪制更立體的玫瑰花,文中的示例代碼講解詳細(xì),對我們學(xué)習(xí)Matlab有一定的幫助,需要的可以參考一下2023-02-02C語言實(shí)現(xiàn)輸入兩個數(shù)字將其按從小到大輸出的方法
這篇文章主要介紹了C語言實(shí)現(xiàn)輸入兩個數(shù)字將其按從小到大輸出的方法,本文通過代碼講解的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-04-04