快捷導(dǎo)航

C/C++?判斷計(jì)算機(jī)存儲(chǔ)器字節(jié)序（端序）的幾種方式

更新時(shí)間：2024年10月05日 08:59:22 作者：escwqa

字節(jié)序是計(jì)算機(jī)存儲(chǔ)數(shù)據(jù)的格式,主存儲(chǔ)器（主存）的字節(jié)序?qū)Τ绦虻囊浦残院图嫒菪灾陵P(guān)重要,利用聯(lián)合體、指針、位移和掩碼等方法可以檢測(cè)和處理字節(jié)序問題,對(duì)于內(nèi)存數(shù)據(jù)操作重要,也關(guān)系到跨平臺(tái)和網(wǎng)絡(luò)通信的數(shù)據(jù)處理

主存字節(jié)序

所謂字節(jié)序就是字節(jié)排列的順序，拿主存來說就是如果低字節(jié)存放在低地址處，就是低端字節(jié)序（小端），反之為高端字節(jié)序（大端）。拿 0x1234567 來說：

判斷字節(jié)序

通過指針

既然字節(jié)序就是字節(jié)的排列順序，那么我們把至少 2 字節(jié)的字節(jié)序列存放到主存中，如果能獲取該數(shù)據(jù)的最低或最高地址的 1 字節(jié)數(shù)據(jù)，不就知道字節(jié)序了嗎？對(duì)應(yīng) C/C++ 來說就是指針。

#include <stdio.h>

int main(void)
{
    unsigned int i = 1;
    char *ch_ptr = (char*)&i;  // 創(chuàng)建一個(gè)指向 i 的字符（字節(jié)）指針

    if (*ch_ptr)
    {
        printf("Little-Endian\n");  // 如果 *ch_ptr 為 1，表示最低位字節(jié)為 1，為小端
    }
    else
    {
        printf("Big-Endian\n");     // 否則為大端
    }

    return 0;
}

為了保障可移植性，我這里用的是 unsigned int i，以確保每個(gè)平臺(tái)都至少 2 個(gè)字節(jié)。其它數(shù)據(jù)類型甚至是數(shù)組都是可以的，沒有本質(zhì)的區(qū)別，都是在主存中存儲(chǔ)相應(yīng)數(shù)量的字節(jié)序列。

使用聯(lián)合體（Union）

聯(lián)合體允許在相同的內(nèi)存位置存儲(chǔ)不同的數(shù)據(jù)類型，并且可以通過不同的成員來檢視同一塊內(nèi)存區(qū)域。利用該特性，我們可以在聯(lián)合體中定義兩個(gè)成員，其中一個(gè)成員確保為 1 字節(jié)（當(dāng)然，也可以定義成數(shù)組，然后取數(shù)組中的第一個(gè)元素），而另一個(gè)成員則確保每個(gè)平臺(tái)都至少為 2 字節(jié)。

#include <stdio.h>

typedef union
{
	unsigned int i;
	char byte;
} ByteOrder;

int main(void)
{
    ByteOrder order;
    order.i = 1;  // 將整數(shù) 1 存儲(chǔ)到聯(lián)合體中

    if (order.byte)
	{
        printf("Little-Endian\n");  // 如果最低位字節(jié)存儲(chǔ)的是 1，則為小端
    }
	else
	{
        printf("Big-Endian\n");     // 否則為大端
    }

    return 0;
}

如前所述，char byte 可以改為 char ch_arr[sizeof(unsigned int)] 形式的數(shù)組，然后需要將 order.byte 改為 order.ch_arr[0]。

這兩種方法本質(zhì)上是一樣的，都是通過判斷數(shù)據(jù)的低位字節(jié)在內(nèi)存中的位置來判斷字節(jié)序。可以根據(jù)實(shí)際情況選擇其中一種方法來使用。

除了使用聯(lián)合體和指針外，還有一些其它方法可以檢測(cè)字節(jié)序。

位移和掩碼

這種方法利用位操作（位移和掩碼）來檢測(cè)字節(jié)序。它不依賴于聯(lián)合體，也不需要指針操作，而是直接通過數(shù)值操作來判斷：

#include <stdio.h>

int main(void)
{
	unsigned int i = 1; // 只有最低位是 1 的整數(shù)

    if ( (i >> 0) & 1 ) // 將 i 右移 0 位后與 1 進(jìn)行與操作
	{
        printf("Little-Endian\n");
    }
	else
	{
        printf("Big-Endian\n");
    }

    return 0;
}

這種方法簡(jiǎn)單明了，通過將整數(shù) 1（其二進(jìn)制形式在小端中為 01 00 00 00，在大端中為 00 00 00 01）的最低位（最右邊的位）與 1 進(jìn)行與操作。如果結(jié)果為 1，那么說明機(jī)器是小端字節(jié)序。

這種方法的好處是代碼簡(jiǎn)單，且沒有使用額外的內(nèi)存（如聯(lián)合體或指針）。它直接通過整型數(shù)值本身的操作來確定字節(jié)序。

性能對(duì)比

聯(lián)合體：這種方法涉及訪問聯(lián)合體的不同成員。聯(lián)合體方法的優(yōu)點(diǎn)是直觀易懂，但訪問聯(lián)合體成員可能導(dǎo)致微小的性能開銷，尤其是在編譯器優(yōu)化不足的情況下。

指針：這種方法涉及將一個(gè)整數(shù)的地址轉(zhuǎn)換為字符指針，然后檢查具體的字節(jié)。這種方法可能稍微快一點(diǎn)，因?yàn)樗苯硬僮鲀?nèi)存，沒有額外的抽象層。然而，這通常是微不足道的。

位移和掩碼：此方法使用位操作來檢查字節(jié)序。位操作效率非常高，因?yàn)樗侵苯釉诩拇嫫骷?jí)別上進(jìn)行的，沒有內(nèi)存訪問的開銷。

在大多數(shù)實(shí)際應(yīng)用中，字節(jié)序的檢查通常只在程序啟動(dòng)或初始化階段進(jìn)行一次，因此這里的性能差異幾乎可以忽略不計(jì)。即便如此，從純粹理論和微優(yōu)化的角度來看，位移和掩碼方法可能是最快的，因?yàn)樗苊饬巳魏蝺?nèi)存訪問，直接在處理器中完成所有操作。

然而，選擇哪種方法應(yīng)該基于代碼的可讀性、可維護(hù)性以及平臺(tái)兼容性，而不僅僅是微小的性能差異。在大多數(shù)情況下，清晰和正確的代碼要比微小的性能提升更加重要。

其它方法

除了前面提到的 3 種常見方法，還可以使用一些更具體或高級(jí)的技術(shù)來檢測(cè)或處理字節(jié)序問題，尤其是在涉及到跨平臺(tái)兼容性或網(wǎng)絡(luò)通信時(shí)。

標(biāo)準(zhǔn)庫函數(shù)

在某些編程環(huán)境中，標(biāo)準(zhǔn)庫提供了函數(shù)來處理字節(jié)序問題。例如，在 C 語言中，網(wǎng)絡(luò)編程常用的庫如 <arpa/inet.h> 提供了 htonl() 和 ntohl() 函數(shù)，用于將主機(jī)字節(jié)序轉(zhuǎn)換為網(wǎng)絡(luò)字節(jié)序，或反之。這些函數(shù)自動(dòng)考慮了底層平臺(tái)的字節(jié)序：

#include <stdio.h>
#include <arpa/inet.h>

int main(void)
{
    unsigned int x = 0x12345678;
    unsigned int y = htonl(x);  // 主機(jī)到網(wǎng)絡(luò)字節(jié)序

    if (y == x)
	{
        printf("Big-Endian\n");
    }
	else
	{
        printf("Little-Endian\n");
    }

    return 0;
}

該方法不僅能判斷字節(jié)序，還能在需要的時(shí)候轉(zhuǎn)換字節(jié)序，非常適合網(wǎng)絡(luò)通信中的數(shù)據(jù)交換。

編譯器特定的預(yù)定義宏

一些編譯器提供預(yù)定義的宏來指示目標(biāo)平臺(tái)的字節(jié)序。例如，GCC 和一些其他編譯器可能定義了特定的宏，可以在編譯時(shí)判斷字節(jié)序。這種方法在編譯時(shí)就確定了字節(jié)序，無需運(yùn)行時(shí)檢測(cè)。

GCC 和 Clang 編譯器

GCC 和 Clang 通常不直接提供檢測(cè)字節(jié)序的宏，但你可以根據(jù)平臺(tái)或者架構(gòu)特定的預(yù)定義宏來推斷字節(jié)序。例如，你可以檢查是否定義了特定于某個(gè)架構(gòu)的宏：

#include <stdio.h>

int main(void)
{
#if defined(__BYTE_ORDER__) && __BYTE_ORDER__ == __ORDER_LITTLE_ENDIAN__
    printf("Little-endian\n");
#elif defined(__BYTE_ORDER__) && __BYTE_ORDER__ == __ORDER_BIG_ENDIAN__
    printf("Big-endian\n");
#else
    printf("Unknown byte order\n");
#endif

	return 0;
}

這里使用了 GCC 和 Clang 編譯器提供的 __BYTE_ORDER__ 宏以及相關(guān)的 __ORDER_LITTLE_ENDIAN__ 和 __ORDER_BIG_ENDIAN__ 宏來確定字節(jié)序。

MSVC 編譯器

MSVC 編譯器沒有直接提供檢測(cè)字節(jié)序的宏，因?yàn)?Windows 平臺(tái)通常是小端字節(jié)序。如果你在使用 Visual Studio 且需要編寫可移植的代碼，可能需要自行定義這些宏或者使用其他方法來確定字節(jié)序。

跨平臺(tái)編譯

如果項(xiàng)目涉及不同的編譯器和平臺(tái)，就需要組合多種方法來使用，確保在這些宏未定義的情況下中也能夠處理。

#include <stdio.h>

int main(void)
{
#if defined(__BYTE_ORDER__) && __BYTE_ORDER__ == __ORDER_LITTLE_ENDIAN__
    printf("Little-endian\n");
#elif defined(__BYTE_ORDER__) && __BYTE_ORDER__ == __ORDER_BIG_ENDIAN__
    printf("Big-endian\n");
#elif defined(_BIG_ENDIAN)
    printf("Big-endian\n");
#elif defined(_LITTLE_ENDIAN)
    printf("Little-endian\n");
#else
    printf("Byte order unknown or assuming default (e.g., little-endian)\n");
#endif

	return 0;
}

常見 CPU 的字節(jié)序

大端字節(jié)序：IBM、Sun、PowerPC。

小端字節(jié)序：x86、DEC 。

ARM 體系的 CPU 則大小端字節(jié)序通吃，具體用哪類字節(jié)序由硬件選擇。

到此這篇關(guān)于C/C++ 判斷計(jì)算機(jī)存儲(chǔ)器字節(jié)序（端序）的幾種方式的文章就介紹到這了,更多相關(guān)C/C++ 字節(jié)序與數(shù)據(jù)存儲(chǔ)及通信內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: