網(wǎng)頁中使用Unicode字符的介紹(&#,\u等)

最早的計算機只能使用ASCII字符,但隨著計算機應用范圍的擴展,很多國家都設計了用于計算機的特殊字符集,使自己國家和民族的字母及文字都能在計算機上顯示和處理,比如中國的GB2312碼。后來出現(xiàn)了互聯(lián)網(wǎng),把整個世界都連了進來,在一臺計算機甚至一個界面上顯示多國多民族文字變成現(xiàn)實的需要。國際組織制定了可以容納世界上所有文字和符號的字符編碼方案,稱為Unicode,是通用字符集Universal Character Set的縮寫,用以滿足跨語言、跨平臺進行文本轉換、處理的要求,自從1994年發(fā)布,不斷進行擴展,目前已經(jīng)到了Version 10。
可以進入網(wǎng)址https://www.unicode.org/查詢詳細信息,包括下載最新版本的碼表。
在設計網(wǎng)頁時,就可以使用Unicode字符集,使用時根據(jù)是在HTML、CSS中,還是在JavaScript中,而有不同的方法。
1)HTML中使用:&#dddd;或&#xhhhh;
其中dddd表示4位10進制數(shù)值,hhhh表示4位16進制數(shù)值,兩種格式分別以&#及&#x為前綴,表示為10進制碼或者16進制的Unicode碼,都需要以分號為后綴。目前,使用4位16進制碼的Unicode字符獲得比較好的支持,大多數(shù)都可以在網(wǎng)頁中正常顯示,但其他更多的Unicode字符往往還不能顯示出來,這是因為使用的計算機平臺還沒有安裝相關的Unicode支持。示例:
<p>顯示Unicode字符--?</p>
其中顯示了一個數(shù)學符號,Unicode碼為2230,可以使用“∰”或“∰”來輸出這個特殊字符,然后就可以在頁面中顯示出來了。
2)CSS中使用:\hhhh
CSS中使用Unicode字符的場合比較少,但偶爾也會用到,一般是使用4位16進制Unicode碼表示,前綴為反斜符。
3)JavaScript中使用:\uhhhh
JavaScript代碼中經(jīng)常會用到輸出特殊字符,如在某個元素中輸出溫度或角度符,使用希臘字母、羅馬數(shù)字等,只需要在4位Unicode的16進制碼前面加上前綴“\u”即可。示例:
document.body.innerHTML="\u25D0";
其中使用了Unicode碼25D0,在幾何圖形表中,是一個圓形圖案,一般填充白色一半填充黑色,像半個月亮。
當然,中國人最常見的使用Unicode碼的場合是用漢字。為了顯示更多的漢字,漢字庫先從GB2312擴展到GBK,目前又擴展到GB18030。最新版本的GB18030已經(jīng)收入7萬多個漢字,還包括各種少數(shù)民族文字,還有一些特殊字符,這個標準與Unicode碼方式是一致的。當然,有些計算機未必安裝了完整的新版本的支持軟件,所以往往只能顯示一部分字符。
為了獲得一個漢字的Unicode碼,可以使用JavaScript函數(shù)charCodeAt(),例如:
var ucode="趙".charCodeAt();
這樣就把漢字“趙”的Unicode代碼存入變量ucode中,可以獲取得到Unicode碼為36213,這是一個十進制的Unicode碼??梢允褂胻oString(16)方法把這個10進制碼轉為16進制碼:
var ucode="趙".charCodeAt().toString(16);
這樣獲得的就是漢字“趙”的16進制形式的Unicode碼,得到的值為8d75。
一般情況下輸出漢字,可以將包括漢字的字符串直接顯示。也可以使用漢字的Unicode碼輸出對應的漢字或其他字符:
String.fromCharCode(36213);
這樣就將十進制Unicode碼為36213的字符轉換為字符串,然后將此字符串輸出就會顯示漢字“趙”。因為漢字可以使用輸入法直接得到字符串,所以這種方法往往用來輸出一些特殊字符。
把&#編碼轉換成字符
這是unicode編碼,編碼過程這樣:
比如要把“楊”編碼,我們可以新建一個記事本,輸入“楊”保存時選擇存為unicode編碼,然后查看文件二進制內容,前面的FF FE兩個字節(jié)是unicode編碼文件頭標志,接著的68 67兩個字節(jié)就是“楊”的unicode編碼,用計算器換算為十進制就是26472,現(xiàn)在可以在一個html文件里面寫入“楊”,IE打開就顯示一個“楊”字。
當然,對于一般ASCII碼,unicode編碼與ASCII編碼一致,所以A可以顯示一個大寫字母“A”.
把&#編碼轉換成字符
function uncode(str) { return str.replace(/&#(x)?([^&]{1,5});?/g, function (a, b, c) { return String.fromCharCode(parseInt(c, b ? 16 : 10)); }); }
把字符轉換成&#編碼
function encode(str) { var a = [], i = 0; for (; i < str.length ;) a[i] = str.charCodeAt(i ++); return "&#" + a.join(";&#") + ";"; }
到此這篇關于網(wǎng)頁中使用Unicode字符的介紹(&#,\u等)的文章就介紹到這了,更多相關Unicode內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持腳本之家!
相關文章
15 個為編程初學者準備的網(wǎng)站(都是國外的一些網(wǎng)站)
今天的文章,我們將分享15個可以學習編程的網(wǎng)站,這些網(wǎng)站上提供了很多編程教程,圖書以及編程練習,希望對你有用2024-11-02- 這篇文章主要介紹了web開發(fā)中的長度單位主要包括px,pt,em等,需要的朋友可以參考下2023-08-06
網(wǎng)頁前端開發(fā)的一些尺寸單位(px,rem單位)
px單位是絕對單位,一般用于pc端網(wǎng)頁開發(fā),因為是絕對單位所以在移動端上的使用體驗并不是很好,rem它是描述相對于當前根元素字體尺寸,是相對單位,它可以根據(jù)根元素的變換而2023-08-06WEB前端優(yōu)化必備js/css壓縮工具YUI-compressor詳解與集成用法
壓縮工具層次不窮,各有優(yōu)點,選擇適合的壓縮工具為將來做項目開發(fā)使用是一件很重要的事情??!在這介紹YUI-compressor,需要的朋友可以參考下2023-06-21- 瀏覽器是多進程的,有瀏覽器主進程,網(wǎng)絡進程,渲染進程,插件進程等,在將html,css,javascript解析成一個頁面的時候,就需要多個進程的分工合作2023-05-01
- 本文為大家整理了常用的文件對應的MIME類型,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2022-04-25
postman中form-data、x-www-form-urlencoded、raw、binary的區(qū)別介紹
這篇文章介紹了postman中form-data、x-www-form-urlencoded、raw、binary的區(qū)別,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2021-12-28網(wǎng)頁中使用Unicode字符的介紹(&#,\u等)
國際組織制定了可以容納世界上所有文字和符號的字符編碼方案,稱為Unicode,是通用字符集Universal Character Set的縮寫,用以滿足跨語言、跨平臺進行文本轉換、處理的要求2021-11-27前端實現(xiàn)字符串GBK與GB2312的編解碼(小結)
這篇文章主要介紹了前端實現(xiàn)字符串GBK與GB2312的編解碼(小結),小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2020-12-02- 這篇文章主要介紹了告別硬編碼讓你的前端表格自動計算,本文通過實例代碼給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-09-27