編輯器寫C語言輸出中文亂碼問題及解決

更新時間：2023年09月08日 16:55:18 作者：是嚴寒呀

這篇文章主要介紹了編輯器寫C語言輸出中文亂碼問題及解決方案,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教

編輯器寫C語言輸出中文亂碼

在寫C語言時，有時候需要使用printf輸出中文，如果使用IDE來寫代碼，例如使用VisualStudio，輸出中文沒有問題。

但是當使用編輯器+編譯器的方式寫代碼，在這個環(huán)境下輸出中文可能會遇到中文輸出亂碼。

環(huán)境

編輯器：VSCode
編譯器：Mingw-w64

C語言代碼：

#include <stdio.h>
int main() 
{
    char a[2048];
    FILE *fp;
    if ((fp = fopen("test.txt", "r+")) == NULL) {
        printf("無法打開\n");
        return 0;
    }
    fscanf(fp, "%s", &a);
    printf("a的值:%s\n", a); 
    fclose(fp);
    return 0;
}

代碼說明：上述代碼的主要作用是讀取文件的內(nèi)容，并將讀取內(nèi)容輸出在屏幕上

文件內(nèi)容：

說明：test.txt 文件是通過右鍵新建文本文檔建立的。

過程

1.編譯：使用gcc main.c -o main，生成可執(zhí)行文件main.exe

2.運行：輸入main.exe 運行程序（注：test.txt和C源文件在同一個文件夾下）

分析原因：

這時候輸出中文異常，但是讀取的內(nèi)容沒有問題。

這里關(guān)注兩個：一是為什么"printf("a的值:%s\n", a)"這句代碼中的漢字在輸出時亂碼，二是同樣漢字，讀取的內(nèi)容沒有問題。

第一個問題是因為編碼不一致，也就是文件的編碼和系統(tǒng)終端（也就是cmd）的默認編碼是不一樣的，中文系統(tǒng)里cmd的默認編碼是GBK，而在VSCode中文件的編碼是UTF-8。當這兩個編碼不一樣時，會出現(xiàn)中文亂碼，準確說是異常。

圖：VSCode的文件默認編碼是UTF-8

第二個問題為什么讀取內(nèi)容沒問題呢，這是因為Windows文本文檔的默認編碼是ANSI（在中文系統(tǒng)里即GBK）（ANSI和ASCII的關(guān)系：簡單說就是ANSI是對ASCII的擴展，兼容ASCII），cmd默認輸出編碼是ASCII（即GBK），所以讀取了文件內(nèi)容再將內(nèi)容輸出到cmd終端沒有問題。

圖：通過文件-另存為可以查看到這個文件的編碼方式，默認為ANSI