文本文件編碼方式區(qū)別
更新時(shí)間:2008年09月11日 20:10:48 作者:
當(dāng)一個(gè)軟件打開一個(gè)文本時(shí),它要做的第一件事是決定這個(gè)文本究竟是使用哪種字符集的哪種編碼保存的。
軟件一般采用三種方式來決定文本的字符集和編碼:
檢測(cè)文件頭標(biāo)識(shí),提示用戶選擇,根據(jù)一定的規(guī)則猜測(cè)
最標(biāo)準(zhǔn)的途徑是檢測(cè)文本最開頭的幾個(gè)字節(jié),開頭字節(jié)Charset/encoding,如下表:
EF BB BF UTF-8
FE FF UTF-16/UCS-2, little endian
FF FE UTF-16/UCS-2, big endian
FF FE 00 00 UTF-32/UCS-4, little endian.
00 00 FE FF UTF-32/UCS-4, big-endian.
檢測(cè)文件頭標(biāo)識(shí),提示用戶選擇,根據(jù)一定的規(guī)則猜測(cè)
最標(biāo)準(zhǔn)的途徑是檢測(cè)文本最開頭的幾個(gè)字節(jié),開頭字節(jié)Charset/encoding,如下表:
EF BB BF UTF-8
FE FF UTF-16/UCS-2, little endian
FF FE UTF-16/UCS-2, big endian
FF FE 00 00 UTF-32/UCS-4, little endian.
00 00 FE FF UTF-32/UCS-4, big-endian.
相關(guān)文章
Git回退代碼到某次commit的實(shí)現(xiàn)方法
這篇文章主要介紹了Git回退代碼到某次commit的實(shí)現(xiàn)方法,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-07-07計(jì)算機(jī)網(wǎng)絡(luò)日常練習(xí)題,每天進(jìn)步一點(diǎn)點(diǎn)
下面小編就為大家?guī)硪黄?jì)算機(jī)網(wǎng)絡(luò)的幾道練習(xí)題(分享)。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧,希望可以幫到你2021-09-09vscode使用editorconfig插件以及.editorconfig配置文件說明詳解
這篇文章主要介紹了vscode使用editorconfig插件以及.editorconfig配置文件說明詳解,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-04-0412個(gè)Visual Studio調(diào)試效率技巧(小結(jié))
這篇文章主要介紹了12個(gè)Visual Studio調(diào)試效率技巧,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2020-07-07vscode安裝rainbow-fart(鼓勵(lì)師)插件
這篇文章主要介紹了vscode安裝rainbow-fart(鼓勵(lì)師)插件的相關(guān)知識(shí),本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-06-06關(guān)于Typora中l(wèi)atex的用法與常用語法
這篇文章主要介紹了關(guān)于Typora中l(wèi)atex的用法與常用語法,typora使用latex進(jìn)行公式的編寫,本文說明了常用的語法,需要的朋友可以參考下2023-04-04