文本文件編碼方式區(qū)別
更新時間:2008年09月11日 20:10:48 作者:
當(dāng)一個軟件打開一個文本時,它要做的第一件事是決定這個文本究竟是使用哪種字符集的哪種編碼保存的。
軟件一般采用三種方式來決定文本的字符集和編碼:
檢測文件頭標(biāo)識,提示用戶選擇,根據(jù)一定的規(guī)則猜測
最標(biāo)準(zhǔn)的途徑是檢測文本最開頭的幾個字節(jié),開頭字節(jié)Charset/encoding,如下表:
EF BB BF UTF-8
FE FF UTF-16/UCS-2, little endian
FF FE UTF-16/UCS-2, big endian
FF FE 00 00 UTF-32/UCS-4, little endian.
00 00 FE FF UTF-32/UCS-4, big-endian.
檢測文件頭標(biāo)識,提示用戶選擇,根據(jù)一定的規(guī)則猜測
最標(biāo)準(zhǔn)的途徑是檢測文本最開頭的幾個字節(jié),開頭字節(jié)Charset/encoding,如下表:
EF BB BF UTF-8
FE FF UTF-16/UCS-2, little endian
FF FE UTF-16/UCS-2, big endian
FF FE 00 00 UTF-32/UCS-4, little endian.
00 00 FE FF UTF-32/UCS-4, big-endian.
相關(guān)文章
Git回退代碼到某次commit的實(shí)現(xiàn)方法
這篇文章主要介紹了Git回退代碼到某次commit的實(shí)現(xiàn)方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-07-07計算機(jī)網(wǎng)絡(luò)日常練習(xí)題,每天進(jìn)步一點(diǎn)點(diǎn)
下面小編就為大家?guī)硪黄嬎銠C(jī)網(wǎng)絡(luò)的幾道練習(xí)題(分享)。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧,希望可以幫到你2021-09-09vscode使用editorconfig插件以及.editorconfig配置文件說明詳解
這篇文章主要介紹了vscode使用editorconfig插件以及.editorconfig配置文件說明詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-04-0412個Visual Studio調(diào)試效率技巧(小結(jié))
這篇文章主要介紹了12個Visual Studio調(diào)試效率技巧,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2020-07-07關(guān)于Typora中l(wèi)atex的用法與常用語法
這篇文章主要介紹了關(guān)于Typora中l(wèi)atex的用法與常用語法,typora使用latex進(jìn)行公式的編寫,本文說明了常用的語法,需要的朋友可以參考下2023-04-04