VS+QT編譯環(huán)境中字符亂碼問題解決方法
字符亂碼問題詳解
在解釋字符亂碼問題之前,我們需要先理清一些基本概念
1 編碼字符集與字符編碼方式
編碼字符集
編碼字符集是所有字符以及對應(yīng)代碼值的集合。編碼字符集中的每個字符都對應(yīng)一個唯一的代碼值。常見的編碼字符集:ASCII字符集、GBXXXX字符集、BIG5字符集、Unicode字符集等。
字符編碼方式
編碼字符集中只規(guī)定了字符的代碼值并未規(guī)定具體如何存儲,字符編碼方式解決了字符在計算機(jī)中如何存儲的問題,它是將編碼字符集中的字符代碼值轉(zhuǎn)換為實(shí)際的存儲字節(jié)序列的一種映射規(guī)則。常見字符編碼方式:ASCII編碼、GBXXXX編碼、BIG5編碼、UTF-8編碼、UTF-16編碼、UTF-32編碼等。每種編碼字符集至少對應(yīng)一種字符編碼方式,也可以對應(yīng)多種編碼方式。
什么是字符的編碼與解碼?
編碼就是把?個字符編碼成二進(jìn)制碼存起來的方式,而解碼就是把這個二進(jìn)制碼按照原本編碼的規(guī)則還原成原來的字符。
源字符集: 源文件字符集是指源文件保存時按源字符集編碼方式編碼后的字符集。VS2019源字符集編碼格式默認(rèn)是GBK格式,在利用VS編寫代碼時,源代碼會自動編碼為GBK字符集。
執(zhí)行字符集: 程序運(yùn)行時所使用的字符集,編譯器會將源字符集先按照源字符集編碼方式進(jìn)行解碼,再將解碼后得到的字符按照執(zhí)行字符集編碼方式編碼為執(zhí)行字符集。執(zhí)行字符集一般默認(rèn)使用Windows系統(tǒng)本地字符編碼,若是簡體中文系統(tǒng),則是GBK或GB2312字符集。
2 字符亂碼原因
在編程中我們給某個函數(shù)輸入中文字符串的時候,在運(yùn)行的時候中文字符串往往就會變成亂碼,這是因?yàn)榫幋a方式與解碼方式不一致造成的。
例:
VS+QT編譯環(huán)境中,如果直接將中文字符串傳給QT函數(shù)時,會出現(xiàn)亂碼:
QString s("你好");//亂碼 qDebug() << "路漫漫其修遠(yuǎn)兮";//亂碼
原因在于這些中文字符串被GBK編碼為源字符集,編譯器會先采用GBK將這被GBK編碼的源字符集解碼,再用GB2312編碼為執(zhí)行字符集,而Qt5內(nèi)部采用Unicode字符集,UTF-16編碼,QT中的函數(shù)會將執(zhí)行字符集使用UTF-8解碼,再使用UTF-16編碼為unicode字符集,QString內(nèi)部使用UTF-8對執(zhí)行字符集進(jìn)行解碼的時候,與執(zhí)行字符集編碼格式不一致,肯定會出現(xiàn)亂碼現(xiàn)象。
為什么英文字符就不會出現(xiàn)亂碼現(xiàn)象呢?
英文字符通常都是ASCII字符編碼,常見的字符編碼都會以某種形式“兼容”ASCII編碼,而我們接觸比較多的UTF-8和GBK則是完全兼容ASCII,也就是ASCII編碼的數(shù)據(jù),在UTF-8、GBK中會是一樣的數(shù)字形式(一個字節(jié))。即
AB在ASCII編碼中對應(yīng)的是0x41和0x42,在GB2312和UTF-8中還是0x41和0x42,所以對于AB這兩個字符用GB2312編碼為0x41和0x42后,采用UTF-8再進(jìn)行解碼,得出來的仍然是AB,所以不會出現(xiàn)亂碼。
3 字符亂碼解決方案
(1)使用QStringLiteral宏
從“字符串常量”創(chuàng)建QString對象
qDebug() << QStringLiteral("路漫漫其修遠(yuǎn)兮");
QStringLiteral宏它只能處理常量。
(2)使用fromLocal8Bit()函數(shù)
fromLocal8Bit是Qt 中QString 類的一個成員函數(shù),用于將使用本地編碼的字符串轉(zhuǎn)換為 QString 對象的內(nèi)部 Unicode編碼。
qDebug() << QString::fromLocal8Bit("路漫漫其修遠(yuǎn)兮");
使用QStringLiteral宏和fromLocal8Bit()函數(shù)輸出的字符串還帶有雙引號:
使用下面的這兩個方法可以解決這種問題。
(3)使用#pragma execution_character_set(“utf-8”)
源程序中加上如下指令,將源文件的可執(zhí)行字符集編碼方式設(shè)置為utf-8
#pragma execution_character_set("utf-8") qDebug() << "路漫漫其修遠(yuǎn)兮";
(4)使用u8關(guān)鍵字
C++17到來后出現(xiàn)了u8關(guān)鍵字,表示一個字符串的可執(zhí)行字符集編碼方式是UTF-8編碼
qDebug() << u8"路漫漫其修遠(yuǎn)兮"
到此這篇關(guān)于VS+QT編譯環(huán)境中字符亂碼問題詳解的文章就介紹到這了,更多相關(guān)VS QT字符亂碼內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
C++面向?qū)ο髮?shí)現(xiàn)萬年歷的示例代碼
本文將通過面向?qū)ο髮?shí)現(xiàn)一個簡單的日歷(萬年歷)效果,主要會有以下幾個模塊:模型、視圖、控制,感興趣的小伙伴可以動手嘗試一下2022-06-06C++實(shí)現(xiàn)神經(jīng)BP神經(jīng)網(wǎng)絡(luò)
這篇文章主要為大家詳細(xì)介紹了C++實(shí)現(xiàn)神經(jīng)BP神經(jīng)網(wǎng)絡(luò),文中示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下2020-05-05C語言實(shí)現(xiàn)多線程定時器實(shí)例講解
在本篇文章里小編給各位分享的是一篇關(guān)于C語言實(shí)現(xiàn)多線程定時器實(shí)例講解內(nèi)容,有需要的朋友們可以參考學(xué)習(xí)下。2021-01-01C語言通過gets和gets_s分別實(shí)現(xiàn)讀取含空格的字符串
在遇到包含空格的字符串輸入時該如何讀取呢?如果使用scanf以%s格式去讀取輸入的字符串,遇到空格就讀取結(jié)束了,顯然這樣是讀取不了的。本文就將介紹兩個可以對含空格字符串讀取的庫函數(shù)------gets和gets_s函數(shù),感興趣的可以了解一下2021-12-12C++ Qt開發(fā)之PushButton按鈕組件的使用詳解
Qt 是一個跨平臺C++圖形界面開發(fā)庫,利用Qt可以快速開發(fā)跨平臺窗體應(yīng)用程序,本文將重點(diǎn)介紹QPushButton按鈕組件的常用方法及靈活運(yùn)用,感興趣的小伙伴可以學(xué)習(xí)一下2023-12-12C++11/14 線程調(diào)用類對象和線程傳參的方法
這篇文章主要介紹了C++11/14 線程調(diào)用類對象和線程傳參的方法,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2019-01-01詳解數(shù)據(jù)結(jié)構(gòu)C語言實(shí)現(xiàn)之循環(huán)隊(duì)列
在我們生活中有很多隊(duì)列的影子,可以說與時間相關(guān)的問題,一般都會涉及到隊(duì)列問題;本文詳細(xì)介紹了如何使用C語言實(shí)現(xiàn)循環(huán)隊(duì)列,下面一起來看看。2016-07-07