mysql字符集和校對規(guī)則(Mysql校對集)
字符集和校對規(guī)則
字符集是一套符號和編碼。校對規(guī)則是在字符集內(nèi)用于比較字符的一套規(guī)則。
MySql在collation提供較強(qiáng)的支持,oracel在這方面沒查到相應(yīng)的資料。
不同字符集有不同的校對規(guī)則,命名約定:以其相關(guān)的字符集名開始,通常包括一個(gè)語言名,并且以_ci(大小寫不敏感)、_cs(大小寫敏感)或_bin(二元)結(jié)束
校對規(guī)則一般分為兩類:
binary collation,二元法,直接比較字符的編碼,可以認(rèn)為是區(qū)分大小寫的,因?yàn)樽址?A'和'a'的編碼顯然不同。
字符集_語言名,utf8默認(rèn)校對規(guī)則是utf8_general_ci
mysql字符集和校對規(guī)則有4個(gè)級別的默認(rèn)設(shè)置:服務(wù)器級、數(shù)據(jù)庫級、表級和連接級。
具體來說,我們系統(tǒng)使用的是utf8字符集,如果使用utf8_bin校對規(guī)則執(zhí)行sql查詢時(shí)區(qū)分大小寫,使用utf8_general_ci 不區(qū)分大小寫。不要使用utf8_unicode_ci。
如create database demo CHARACTER SET utf8; 默認(rèn)校對規(guī)則是utf8_general_ci 。
Unicode與UTF8
Unicode只是一個(gè)符號集,它只規(guī)定了符號的二進(jìn)制代碼,卻沒有規(guī)定這個(gè)二進(jìn)制代碼應(yīng)該如何存儲.
UTF8字符集是存儲Unicode數(shù)據(jù)的一種可選方法。mysql同時(shí)支持另一種實(shí)現(xiàn)ucs2。
詳細(xì)說明
字符集(charset):是一套符號和編碼。
校對規(guī)則(collation):是在字符集內(nèi)用于比較字符的一套規(guī)則,比如定義'A'<'B'這樣的關(guān)系的規(guī)則。不同collation可以實(shí)現(xiàn)不同的比較規(guī)則,如'A'='a'在有的規(guī)則中成立,而有的不成立;進(jìn)而說,就是有的規(guī)則區(qū)分大小寫,而有的無視。
每個(gè)字符集有一個(gè)或多個(gè)校對規(guī)則,并且每個(gè)校對規(guī)則只能屬于一個(gè)字符集。
binary collation,二元法,直接比較字符的編碼,可以認(rèn)為是區(qū)分大小寫的,因?yàn)樽址?A'和'a'的編碼顯然不同。除此以外,還有更加復(fù)雜的比較規(guī)則,這些規(guī)則在簡單的二元法之上增加一些額外的規(guī)定,比較就更加復(fù)雜了。
mysql5.1在字符集和校對規(guī)則的使用比其它大多數(shù)數(shù)據(jù)庫管理系統(tǒng)超前許多,可以在任何級別進(jìn)行使用和設(shè)置,為了有效地使用這些功能,你需要了解哪些字符集和 校對規(guī)則是可用的,怎樣改變默認(rèn)值,以及它們怎樣影響字符操作符和字符串函數(shù)的行為。
校對規(guī)則一般有這些特征:
兩個(gè)不同的字符集不能有相同的校對規(guī)則。
每個(gè)字符集有一個(gè)默認(rèn)校對規(guī)則。例如,utf8默認(rèn)校對規(guī)則是utf8_general_ci。
存在校對規(guī)則命名約定:它們以其相關(guān)的字符集名開始,通常包括一個(gè)語言名,并且以_ci(大小寫不敏感)、_cs(大小寫敏感)或_bin(二元)結(jié)束
確定默認(rèn)字符集和校對
字符集和校對規(guī)則有4個(gè)級別的默認(rèn)設(shè)置:服務(wù)器級、數(shù)據(jù)庫級、表級和連接級。
數(shù)據(jù)庫字符集和校對
每一個(gè)數(shù)據(jù)庫有一個(gè)數(shù)據(jù)庫字符集和一個(gè)數(shù)據(jù)庫校對規(guī)則,它不能夠?yàn)榭铡REATE DATABASE和ALTER DATABASE語句有一個(gè)可選的子句來指定數(shù)據(jù)庫字符集和校對規(guī)則:
例如:
CREATE DATABASE db_name DEFAULT CHARACTER SET latin1 COLLATE latin1_swedish_ci;
MySQL這樣選擇數(shù)據(jù)庫字符集和數(shù)據(jù)庫校對規(guī)則:
· 如果指定了CHARACTER SET X和COLLATE Y,那么采用字符集X和校對規(guī)則Y。
· 如果指定了CHARACTER SET X而沒有指定COLLATE Y,那么采用CHARACTER SET X和CHARACTER SET X的默認(rèn)校對規(guī)則。
· 否則,采用服務(wù)器字符集和服務(wù)器校對規(guī)則。
在SQL語句中使用COLLATE
•使用COLLATE子句,能夠?yàn)橐粋€(gè)比較覆蓋任何默認(rèn)校對規(guī)則。COLLATE可以用于多種SQL語句中。
使用WHERE:
select * from pro_product where product_code='ABcdefg' collate utf8_general_ci
Unicode與UTF8
Unicode只是一個(gè)符號集,它只規(guī)定了符號的二進(jìn)制代碼,卻沒有規(guī)定這個(gè)二進(jìn)制代碼應(yīng)該如何存儲.Unicode碼可以采用UCS-2格式直接存儲.mysql支持ucs2字符集。
UTF-8就是在互聯(lián)網(wǎng)上使用最廣的一種unicode的實(shí)現(xiàn)方式。其他實(shí)現(xiàn)方式還包括UTF-16和UTF-32,不過在互聯(lián)網(wǎng)上基本不用。
UTF8字符集(轉(zhuǎn)換Unicode表示)是存儲Unicode數(shù)據(jù)的一種可選方法。它根據(jù)RFC 3629執(zhí)行。UTF8字符集的思想是不同Unicode字符采用變長字節(jié)序列編碼:
· 基本拉丁字母、數(shù)字和標(biāo)點(diǎn)符號使用一個(gè)字節(jié)。
· 大多數(shù)的歐洲和中東手寫字母適合兩個(gè)字節(jié)序列:擴(kuò)展的拉丁字母(包括發(fā)音符號、長音符號、重音符號、低音符號和其它音符)、西里爾字母、希臘語、亞美尼亞語、希伯來語、阿拉伯語、敘利亞語和其它語言。
· 韓語、中文和日本象形文字使用三個(gè)字節(jié)序列
摘自:用夢想丈量人生,用奔跑丈量激情
校對集
MySQL5.5.8中共有字符集39,校對集195個(gè)
#顯示所有的校對集
Show collation
#顯示所有的字符集
show character set
所以一個(gè)字符集對應(yīng)多個(gè)校對集,即同樣的一個(gè)字符集有多重排序規(guī)則
比如一個(gè)utf8的字符集共有22中排序規(guī)則
Utf8字符集默認(rèn)的校對集為utf8_general_ci
通過show collation like ‘utf8\_%'
即可查看
注意:
utf8_general_ci 按照普通的字母順序,而且不區(qū)分大小寫(比如:a B c D)
utf8_bin 按照二進(jìn)制排序(比如:A排在a前面,B D a c)
相關(guān)文章
MySQL數(shù)據(jù)庫中null的知識點(diǎn)總結(jié)
在本篇文章里小編給大家整理的是關(guān)于MySQL數(shù)據(jù)庫null的知識點(diǎn)以及相關(guān)實(shí)例,需要的朋友們可以學(xué)習(xí)下。2019-10-10mysql?8.0.27?安裝配置方法圖文教程(Windows64位)
這篇文章主要為大家詳細(xì)介紹了mysql?8.0.27?下載、安裝與配置圖文教程,文中安裝步驟介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-04-04MySql 知識點(diǎn)之事務(wù)、索引、鎖原理與用法解析
這篇文章主要介紹了MySql 知識點(diǎn)之事務(wù)、索引、鎖原理與用法,結(jié)合實(shí)例形式較為詳細(xì)的分析了mysql數(shù)據(jù)庫事務(wù)、索引、鎖的概念、原理、使用方法及相關(guān)操作注意事項(xiàng),需要的朋友可以參考下2019-09-09將MySQL數(shù)據(jù)庫移植為PostgreSQL
PostgreSQL 作為功能最強(qiáng)勁的開源 OO 數(shù)據(jù)庫,仿佛一直不為國內(nèi)用戶所熟識。而我個(gè)人也僅是因?yàn)楣ぷ鞯木壒式佑|到這款超經(jīng)典的數(shù)據(jù)庫,并深為之折服。2009-07-07MySQL中ROUND函數(shù)進(jìn)行四舍五入操作陷阱分析
這篇文章主要介紹了MySQL中ROUND函數(shù)進(jìn)行四舍五入操作陷阱,結(jié)合實(shí)例形式分析了mysql使用ROUND函數(shù)進(jìn)行四舍五入運(yùn)算中出現(xiàn)的問題及其錯(cuò)誤原因,需要的朋友可以參考下2018-06-06使用Canal和Kafka解決MySQL與緩存的數(shù)據(jù)一致性問題
這篇文章主要介紹了使用Canal和Kafka解決MySQL與緩存的數(shù)據(jù)一致性問題,文中通過圖文結(jié)合的方式給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作有一定的幫助,需要的朋友可以參考下2024-07-07