欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

C#讀取二進(jìn)制文件方法分析

 更新時間:2015年01月10日 11:26:45   投稿:shichen2014  
這篇文章主要介紹了C#讀取二進(jìn)制文件方法,較為詳細(xì)的分析了C#讀取二進(jìn)制文件的原理與注意事項,具有一定參考借鑒價值,需要的朋友可以參考下

本文較為詳細(xì)的分析了C#讀取二進(jìn)制文件方法。分享給大家供大家參考。具體分析如下:

當(dāng)想到所有文件都轉(zhuǎn)換為 XML時,確實是一件好事。但是,這并非事實。仍舊還有大量的文件格式不是XML,甚至也不是ASCII。二進(jìn)制文件仍然在網(wǎng)絡(luò)中傳播,儲存在磁盤上,在應(yīng)用程序之間傳遞。相比之下,在處理這些問題方面,它們比文本文件顯得更有效率些。

在 C 和 C++ 中,讀取二進(jìn)制文件還是很容易的。除了一些開始符(carriage return)和結(jié)束符(line feed)的問題,每一個讀到C/C++中的文件都是二進(jìn)制文件。事實上,C/C++ 只知道二進(jìn)制文件,以及如何讓二進(jìn)制文件像文本文件一樣。當(dāng)我們使用的語言越來越抽象時,我們最后使用的語言就不能直接、容易的讀取創(chuàng)建的文件了。這些語言想要用它們自己獨特的方式來自動處理輸出數(shù)據(jù)。

問題的所在:

在許多計算機科學(xué)領(lǐng)域,C 和 C++ 仍舊直接依照數(shù)據(jù)結(jié)構(gòu)來儲存和讀取數(shù)據(jù)。在C和C++中,依照內(nèi)存中的數(shù)據(jù)結(jié)構(gòu)來讀取和寫文件,是十分簡單的。在C中,你只需要使用fwrite()函數(shù),并提供下列參數(shù):一個指向你的數(shù)據(jù)的指針,告訴它有多少個數(shù)據(jù),一個數(shù)據(jù)有多大。這樣,就直接用二進(jìn)制格式把數(shù)據(jù)寫成文件了。

如上所述的那樣把數(shù)據(jù)寫成文件,同時如果你也知道其正確的數(shù)據(jù)結(jié)構(gòu)的話,那么也就意味著讀取文件也很容易。你只要使用 fread() 函數(shù),并提供下列參數(shù):一個文件句柄,一個指向數(shù)據(jù)的指針,讀取多少個數(shù)據(jù),每一個數(shù)據(jù)的長度。 fread() 函數(shù)幫你把其余的事都做了。突然,數(shù)據(jù)又回到了內(nèi)存中。沒有采用解析以及也沒有對象模型的方式,它只是把文件直接的讀到內(nèi)存中。

在C和C++中,最大的兩個問題就是數(shù)據(jù)對齊(structure alignment)和字節(jié)交換(byte swapping)。數(shù)據(jù)對齊指的是有時編譯器會跳過數(shù)據(jù)中間的字節(jié),因為如果處理器訪問到那些字節(jié),就不再處于最優(yōu)化狀態(tài)下了,要花費更多的時間(一般情況,處理器訪問未對齊數(shù)據(jù)花費的時間是訪問對齊數(shù)據(jù)的兩倍),花費更多的指令。因此,編譯器要為了執(zhí)行速度而進(jìn)行優(yōu)化,跳過了那些字節(jié)并重新進(jìn)行排序。另一方面,字節(jié)交換指的是:由于不同處理器對字節(jié)排序的方式不同,需要對數(shù)據(jù)的字節(jié)重新排序的過程。

數(shù)據(jù)對齊

因為處理器能夠一次處理更多的信息(在一個時鐘周期內(nèi)),所以它們希望它們所處理的信息能以一種確定的方式排列。大多數(shù)的 Intel 處理器使整數(shù)類型(32位的)的儲存首地址能被4除盡(即:從能被4除盡的地址上開始儲存)。如果內(nèi)存中的整數(shù)不是儲存在4的倍數(shù)的地址上的話,它們是不會工作的。編譯器知道這些。因此當(dāng)編譯器遇到一個可能引起這種問題的數(shù)據(jù)時,它們就有下面三種選擇。

第一種,它們可以選擇在數(shù)據(jù)中添加一些無用的白空格符,這樣可以使整數(shù)的開始地址能被4除盡。這是一種最普遍的做法。第二種,它們可以對字段重新排序,以便使整數(shù)處于4位的邊界上。因為這樣會造成其它有趣的問題,因此,這種方式較少使用。第三種選擇是,允許數(shù)據(jù)中的整數(shù)不處于4位的邊界上,但是把代碼復(fù)制到一個合適的地方從而使那些整數(shù)處于4位的邊界上。這種方式需要一些額外的時間花費,但是,如果必須壓縮的話,那么它就很有用了。

以上所說的這些大都是編譯器的細(xì)節(jié)問題,你用不著過多的擔(dān)心。如果你對寫數(shù)據(jù)的程序和讀數(shù)據(jù)的程序使用同樣的編譯器,同樣的設(shè)定,那么,這些就不成其為問題了。編譯器用同樣的方法來處理同樣的數(shù)據(jù),一切都OK。但是當(dāng)你涉及到跨平臺文件轉(zhuǎn)換問題時,用正確的方式來排列所有數(shù)據(jù)就顯得很重要了,這樣才能保證信息能被轉(zhuǎn)換。另外,一些程序員還了解怎樣讓編譯器不用理睬他們的數(shù)據(jù)。
字節(jié)交換(byte swapping):高位優(yōu)先(big endians)和低位優(yōu)先(little endians)
 
高位優(yōu)先和低位優(yōu)先,指的是兩種不同的方式,把整數(shù)儲存在計算機中的的方式。因為整數(shù)是多于一個字節(jié)的,那么,問題在于:最重要的字節(jié)是否應(yīng)該首先被讀寫。最不重要的字節(jié)是變化的最頻繁的。這就是,如果你不斷給一個整數(shù)加一,最不重要的字節(jié)要改變256次,次不重要的字節(jié)才只變化一次。

不同的處理器用不同的方式儲存整數(shù)。Intel 處理器一般用低位優(yōu)先方式來儲存整數(shù),換句話說,低位首先被讀寫。大多數(shù)其它處理器用高位優(yōu)先方式來儲存整數(shù)。因此,當(dāng)二進(jìn)制文件在不同平臺上讀寫時,你就有可能不得不對字節(jié)重新排序以便得到正確的順序。

在 UNIX 平臺上,還有一種特殊的問題,因為UNIX可以在Sun Sparc處理器、HP處理器、IBM Power PC、Inter的芯片等多種處理器上運行。當(dāng)從一種處理器轉(zhuǎn)移到另一種處理器上時,就意味著那些變量的字節(jié)排列順序必須翻轉(zhuǎn),以便于它們能滿足新處理器所要求的順序。

用 C# 處理二進(jìn)制文件

用 C# 處理二進(jìn)制文件的話,就會有另外兩項新的挑戰(zhàn)。第一項挑戰(zhàn)是:所有的 .NET 語言都是強類型的。因此,你不得不從文件中的字節(jié)流轉(zhuǎn)換為你所想要的數(shù)據(jù)類型。第二項挑戰(zhàn)就是:一些數(shù)據(jù)類型比它們表面上要復(fù)雜的多,需要某種轉(zhuǎn)換。

類型破壞(type breaking)

因為 .NET 語言,包括 C#,都是強類型的,你不能只是任意的從文件中讀取一段字節(jié),然后塞到數(shù)據(jù)結(jié)構(gòu)中就一切OK了。因此當(dāng)你要破壞類型轉(zhuǎn)換規(guī)則時,你就不得不這樣做了,首先讀取你所需要的字節(jié)數(shù)到一個字節(jié)數(shù)組中,然后把它們從頭到尾的復(fù)制到數(shù)據(jù)結(jié)構(gòu)中。

在 Usenet (注:世界性的新聞組網(wǎng)絡(luò)系統(tǒng))的文檔中搜尋,你會找到幾個構(gòu)架在 microsoft.public.dotnet層次上的一組程序,它們可以容許你把任何對象轉(zhuǎn)換為一系列字節(jié),并可以重新轉(zhuǎn)換回對象。它們可以在下面地址找到 Listing A

復(fù)雜的數(shù)據(jù)類型

在 C++ 中,你明白什么是對象,什么是數(shù)組,什么既不是對象又不是數(shù)組。但是在 C# 中,事情并不像看起來的那樣簡單。一個字符串(string)就是一個對象,因此也是一個數(shù)組。因為在 C# 中,既沒有真正的數(shù)組,許多對象也沒有固定尺寸,因此一些復(fù)雜數(shù)據(jù)類型并不適合成為固定尺寸的二進(jìn)制數(shù)據(jù)。

幸好, .NET 提供了一種方式來解決這種問題。你可以告訴 C# ,你想怎樣處理你的字符串(string)和其它類型的數(shù)組。這將通過 MarshalAs 屬性來完成。下面這個例子,就是在 C# 中使用字符串,這屬性必須要在所控制的數(shù)據(jù)使用之前被使用:

[MarshalAs(UnmanagedType.ByValTStr, SizeConst = 50)]
你想要從二進(jìn)制文件中讀取,或者儲存到二進(jìn)制文件中的字符串(string)的長度就決定了參數(shù) SizeConst 的大小。這樣就確定了字符串長度的最大值。
 解決以前的問題
 
現(xiàn)在,你知道了 .NET 引入的問題是怎樣被解決的了。那么,在后面,你就可以了解到,解決前面所遇到的二進(jìn)制文件問題是那么的容易。

包裝(pack)

不用麻煩的去設(shè)定編譯器來控制如何排列數(shù)據(jù)。你只需使用 StructLayout 屬性就可以使數(shù)據(jù)依照你的意愿來排列或打包。當(dāng)你需要不同的數(shù)據(jù)有著不同的包裝方式的時候,這就顯得十分有用了。這就像裝扮你的汽車一樣,任你的喜好。使用 StructLayout 屬性就像你很小心的決定是否把每一個數(shù)據(jù)都緊湊包裝或者還是只將它們隨便打發(fā),只要它們能夠被重新讀出來就行了。 StructLayout 屬性的使用如下面所示:

復(fù)制代碼 代碼如下:
[StructLayout(LayoutKind.Sequential, Pack = 1)]

這樣做可以使數(shù)據(jù)忽略邊界對齊,讓數(shù)據(jù)盡可能的緊湊包裝。這個屬性應(yīng)當(dāng)和你從二進(jìn)制文件中讀取的任何數(shù)據(jù)的屬性都保持一致(即:你寫到文件中的屬性應(yīng)和從文件讀出來屬性保持不變)。

你也許會發(fā)現(xiàn),即使給你的數(shù)據(jù)加上了這個屬性后,也沒有完全解決問題。在某些情況下,你可能不得不進(jìn)行沉悶冗長的反復(fù)實驗。由于不同計算機和編譯器在二進(jìn)制層次上的有著不同的運行處理方式,這就是引起上述問題的原因。特別是在跨平臺時,我們都必須特別小心的處理二進(jìn)制數(shù)據(jù)。 .NET 是個好工具,適合其它二進(jìn)制文件,但是也并不是一個完美的工具。

字節(jié)排列順序的翻轉(zhuǎn)(endian flipping)

讀寫二進(jìn)制文件的經(jīng)典問題之一就是:某些計算機首先是儲存最不重要的字節(jié)(如:Inter),而另外一些計算機是首先儲存最重要的字節(jié)。在 C 和 C++ 中,你不得不手動處理這個問題,而且只能是一個字段一個字段的翻轉(zhuǎn)。而 .NET 框架的優(yōu)點之一就是:代碼可以在運行時訪問類型的元數(shù)據(jù)(metadata),你也就能夠讀取信息,并使用它來自動解決數(shù)據(jù)中每一段的字節(jié)排列順序問題。在 Listing B 上可以找到源代碼,你可以了解是如何處理的。

一旦你得知對象的類型,你能夠獲得數(shù)據(jù)里的每個部分,并開始檢查每一個部分,并確定其是否是一個16位或32位的無符號整數(shù)。在任何一種上述情況下,你都可以改變字節(jié)的排序順序,而且不會破壞數(shù)據(jù)。

注意:你不是用字符串類(string)來完成所有的事。是采用高位優(yōu)先還是低位優(yōu)先,并不會影響到字符串類。那些字段是不受翻轉(zhuǎn)代碼的影響。你也只是要注意無符號整數(shù)而已。因為,負(fù)數(shù)在不同的系統(tǒng)上,并不是使用同一種表示方式的。負(fù)數(shù)可以只用一個記號(一位字節(jié))表示,但是更常用的,卻是使用兩個記號(兩位字節(jié))表示。這使得負(fù)數(shù)在跨平臺時有些更困難。幸運的是,負(fù)數(shù)在二進(jìn)制文件中極少使用。

這只是多說幾句了,同樣的,浮點數(shù)有時并不是用標(biāo)準(zhǔn)方式表示的。盡管大多數(shù)系統(tǒng)是以IEEE格式為基礎(chǔ)來設(shè)置浮點數(shù)的,但是還是有一小部分老的系統(tǒng)使用了其它的格式來設(shè)置浮點數(shù)的。

克服困難

盡管 C# 還是有一些問題,但是你依舊能夠使用它來讀取二進(jìn)制文件。實際上,由于 C# 所使用的那種用來訪問對象的元數(shù)據(jù)(metadata)的方式,使它成為一種能夠更好讀取二進(jìn)制文件的語言。因此, C# 能夠自動解決整個數(shù)據(jù)的字節(jié)交換(byte swapping)問題。

希望本文所述對大家的C#程序設(shè)計有所幫助。

相關(guān)文章

  • C# Replace替換的具體使用

    C# Replace替換的具體使用

    本文主要介紹了C# Replace替換的具體使用,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2023-02-02
  • Unity中3DText顯示模糊不清的解決方案

    Unity中3DText顯示模糊不清的解決方案

    這篇文章主要介紹了Unity中3DText顯示模糊不清的解決方案,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2021-04-04
  • C#中Socket與Unity相結(jié)合示例代碼

    C#中Socket與Unity相結(jié)合示例代碼

    這篇文章主要給大家介紹了關(guān)于C#中Socket與Unity相結(jié)合的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考借鑒,下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧。
    2017-10-10
  • C#?WPF實現(xiàn)3D操作幾何體效果

    C#?WPF實現(xiàn)3D操作幾何體效果

    眾所周知,我的世界就是無數(shù)個像素塊的集合,而像素塊也就是立方體。關(guān)于新建立方體,這個大家已經(jīng)非常熟練了,本文就來說說如何實現(xiàn)3D操作幾何體效果吧
    2023-03-03
  • C#截取中英文混合指定長度字符串實例

    C#截取中英文混合指定長度字符串實例

    這篇文章主要介紹了C#截取中英文混合指定長度字符串,大家參考使用
    2013-12-12
  • C#獲取文件夾所占空間大小的功能

    C#獲取文件夾所占空間大小的功能

    這篇文章介紹了C#獲取文件夾所占空間大小的方法,文中通過示例代碼介紹的非常詳細(xì)。對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2022-06-06
  • C#?Windows?Forms中實現(xiàn)控件之間的連接線的方法詳解

    C#?Windows?Forms中實現(xiàn)控件之間的連接線的方法詳解

    這篇文章主要為大家詳細(xì)介紹了如何在C#?Windows?Forms應(yīng)用程序中實現(xiàn)繪圖工具中多個控件之間的連接線功能,文中的示例代碼講解詳細(xì),需要的可以參考下
    2024-02-02
  • C#很簡單而又很經(jīng)典的一句代碼實例

    C#很簡單而又很經(jīng)典的一句代碼實例

    這篇文章主要給大家分享介紹了關(guān)于C#很簡單而又很經(jīng)典的一句代碼,文中通過示例代碼介紹的非常詳細(xì),對大家學(xué)習(xí)或者使用C#具有一定的參考學(xué)習(xí)價值,需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-07-07
  • C#自動生成漂亮的水晶效果頭像的實現(xiàn)代碼

    C#自動生成漂亮的水晶效果頭像的實現(xiàn)代碼

    這篇文章主要介紹了C#自動生成漂亮的水晶效果頭像的實現(xiàn)代碼,有需要的朋友可以參考一下
    2013-12-12
  • C#實現(xiàn)利用反射簡化給類字段賦值的方法

    C#實現(xiàn)利用反射簡化給類字段賦值的方法

    這篇文章主要介紹了C#實現(xiàn)利用反射簡化給類字段賦值的方法,涉及C#操作反射的相關(guān)技巧,需要的朋友可以參考下
    2015-05-05

最新評論