網(wǎng)頁編碼為什么不用gbk或者gb2312而用utf-8

能選擇的話還是應(yīng)該用UTF-8
事實上Windows系統(tǒng)自己的程序已經(jīng)全面轉(zhuǎn)向Unicode,而GBK只是為了應(yīng)付中國標(biāo)準的權(quán)宜之計。
GBK的文字編碼是雙字節(jié)來表示的,即不論中、英文字符均使用雙字節(jié)來表示,只不過為區(qū)分中文,將其最高位都定成1。
至于UTF-8編碼則是用以解決國際上字符的一種多字節(jié)編碼,它對英文使用8位(即一個字節(jié)),中文使用24位(三個字節(jié))來編碼。對于英文字符較多的論壇則用UTF-8節(jié)省空間。
GBK包含全部中文字符,
UTF-8則包含全世界所有國家需要用到的字符。
GBK是在國家標(biāo)準GB2312基礎(chǔ)上擴容后兼容GB2312的標(biāo)準(好像還不是國家標(biāo)準)
UTF-8編碼的文字可以在各國各種支持UTF8字符集的瀏覽器上顯示。
比如,如果是UTF8編碼,則在外國人的英文IE上也能顯示中文,而無需他們下載IE的中文語言支持包。
所以,對于英文比較多的論壇 ,使用GBK則每個字符占用2個字節(jié),而使用UTF-8英文卻只占一個字節(jié)。
請注意:UTF-8版本雖然具有良好的國際兼容性,但中文需要比GBK/BIG5版本多占用50%的數(shù)據(jù)庫存儲空間,因此并非推薦使用,僅供對國際兼容性有特殊要求的用戶使用。
簡單地說:
對于中文較多的論壇,適宜用GBK編碼節(jié)省數(shù)據(jù)庫空間。
對于英文較多的論壇,適宜用UTF-8節(jié)省數(shù)據(jù)庫空間。
gbk和gb2312的區(qū)別有哪些
首先大家要了解什么是gbk?什么是gb2312?我們要知道他們都是一種字符編碼,當(dāng)然字符編碼還有很多種。
而字符編碼我們可以這樣理解:
在計算機中存放的都是0和1的二進制值。
8個位對應(yīng)一個字節(jié),常用16進制來表示。
那么我們?nèi)绻胍谟嬎銠C上看到我們想要的字符顯示,而不是各種0和1的數(shù)字該怎么實現(xiàn)呢?
這里我們就需要使計算機把其所存儲的對應(yīng)的16進制的數(shù)值,轉(zhuǎn)化為對應(yīng)的字符,包括英文和中文等其他語言的字符,然后輸出到屏幕上。
所以編碼也就是,定義了一套規(guī)則,去指定哪些數(shù)值,對應(yīng)著哪些字符。
那么字符編碼,就是定義了一套規(guī)則,指定了計算機中存放的這么多值中的哪個值,對應(yīng)了電腦屏幕顯示出來的哪個字母。
綜上所述,大家應(yīng)該都能理解GBK和GB2312是一種字符編碼了吧。
下面我們再具體說說他們的區(qū)別與相同點:
相同點:
1、GBK和GB2312 都是16位的!
2、它們通常用在網(wǎng)頁的meta標(biāo)簽內(nèi)。
不同點:
1、GBK字符編碼支持簡體中文和繁體中文!
GBK全稱《漢字內(nèi)碼擴展規(guī)范》(GBK即“國標(biāo)”、“擴展”漢語拼音的第一個字母,英文名稱:Chinese Internal Code Specification) ,中華人民共和國全國信息技術(shù)標(biāo)準化技術(shù)委員會1995年12月1日制訂,國家技術(shù)監(jiān)督局標(biāo)準化司、電子工業(yè)部科技與質(zhì)量監(jiān)督司1995年12月15日聯(lián)合以技監(jiān)標(biāo)函1995 229號文件的形式,將它確定為技術(shù)規(guī)范指導(dǎo)性文件。
2、GB2312只支持簡體中文!
《信息交換用漢字編碼字符集》是由中國國家標(biāo)準總局1980年發(fā)布,1981年5月1日開始實施的一套國家標(biāo)準,標(biāo)準號是GB 2312—1980。
GB 2312標(biāo)準共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個;同時,GB 2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語西里爾字母在內(nèi)的682個全角字符。
如果你的網(wǎng)頁主要面對使用漢語的中國人的話,使用 GB2312和GBK非常好,文字儲存體積要小,有一些優(yōu)點。如果你的網(wǎng)頁要面向世界的話,你再用GB2312和GBK作為網(wǎng)頁編碼的話,有些電腦上的瀏覽器沒有這種編碼,你的網(wǎng)頁漢字內(nèi)容就會變成無法識別的亂碼。
相關(guān)文章
15 個為編程初學(xué)者準備的網(wǎng)站(都是國外的一些網(wǎng)站)
今天的文章,我們將分享15個可以學(xué)習(xí)編程的網(wǎng)站,這些網(wǎng)站上提供了很多編程教程,圖書以及編程練習(xí),希望對你有用2024-11-02- 這篇文章主要介紹了web開發(fā)中的長度單位主要包括px,pt,em等,需要的朋友可以參考下2023-08-06
網(wǎng)頁前端開發(fā)的一些尺寸單位(px,rem單位)
px單位是絕對單位,一般用于pc端網(wǎng)頁開發(fā),因為是絕對單位所以在移動端上的使用體驗并不是很好,rem它是描述相對于當(dāng)前根元素字體尺寸,是相對單位,它可以根據(jù)根元素的變換而2023-08-06WEB前端優(yōu)化必備js/css壓縮工具YUI-compressor詳解與集成用法
壓縮工具層次不窮,各有優(yōu)點,選擇適合的壓縮工具為將來做項目開發(fā)使用是一件很重要的事情??!在這介紹YUI-compressor,需要的朋友可以參考下2023-06-21- 瀏覽器是多進程的,有瀏覽器主進程,網(wǎng)絡(luò)進程,渲染進程,插件進程等,在將html,css,javascript解析成一個頁面的時候,就需要多個進程的分工合作2023-05-01
- 本文為大家整理了常用的文件對應(yīng)的MIME類型,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2022-04-25
postman中form-data、x-www-form-urlencoded、raw、binary的區(qū)別介紹
這篇文章介紹了postman中form-data、x-www-form-urlencoded、raw、binary的區(qū)別,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-12-28網(wǎng)頁中使用Unicode字符的介紹(&#,\u等)
國際組織制定了可以容納世界上所有文字和符號的字符編碼方案,稱為Unicode,是通用字符集Universal Character Set的縮寫,用以滿足跨語言、跨平臺進行文本轉(zhuǎn)換、處理的要求2021-11-27前端實現(xiàn)字符串GBK與GB2312的編解碼(小結(jié))
這篇文章主要介紹了前端實現(xiàn)字符串GBK與GB2312的編解碼(小結(jié)),小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2020-12-02- 這篇文章主要介紹了告別硬編碼讓你的前端表格自動計算,本文通過實例代碼給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-09-27