MySQL中查詢的有關(guān)英文字母大小寫(xiě)問(wèn)題的分析
mysql數(shù)據(jù)庫(kù)在做查詢時(shí)候,有時(shí)候是英文字母大小寫(xiě)敏感的,有時(shí)候又不是的,主要是由mysql的字符校驗(yàn)規(guī)則的設(shè)置決定的,通常默認(rèn)是不支持的大小寫(xiě)字母敏感的。
1. 什么是字符集和校驗(yàn)規(guī)則?
字符集是一套符號(hào)和編碼。校對(duì)規(guī)則是在字符集內(nèi)用于比較字符的一套規(guī)則。任何一個(gè)給定的字符集至少有一個(gè)校對(duì)規(guī)則,它可能有幾個(gè)校對(duì)規(guī)則。要想列出一個(gè)字符集的校對(duì)規(guī)則,使用SHOW COLLATION語(yǔ)句。
校對(duì)規(guī)則一般有這些特征:
兩個(gè)不同的字符集不能有相同的校對(duì)規(guī)則。
每個(gè)字符集有一個(gè)默認(rèn)校對(duì)規(guī)則。例如,utf8默認(rèn)校對(duì)規(guī)則是utf8_general_ci。
存在校對(duì)規(guī)則命名約定:它們以其相關(guān)的字符集名開(kāi)始,通常包括一個(gè)語(yǔ)言名,并且以_ci(大小寫(xiě)不敏感)、_cs(大小寫(xiě)敏感)或_bin(二元)結(jié)束。
2. 不同級(jí)別的字符集和校驗(yàn)規(guī)則可控制大小寫(xiě)敏感
MySQL5.1在同一臺(tái)服務(wù)器、同一個(gè)數(shù)據(jù)庫(kù)或甚至在同一個(gè)表中使用不同字符集或校對(duì)規(guī)則來(lái)混合定義字符串。字符集和校對(duì)規(guī)則有4個(gè)級(jí)別的默認(rèn)設(shè)置:服務(wù)器級(jí)、數(shù)據(jù)庫(kù)級(jí)、表級(jí)和連接級(jí)。
2.1服務(wù)器級(jí)
MySQL按照如下方法確定服務(wù)器字符集和服務(wù)器校對(duì)規(guī)則:
(1)修改配置文件/etc/my.cnf
在[mysqld]下添加:collation_server = utf8_bin
重啟實(shí)例
更改服務(wù)器級(jí)的校驗(yàn)規(guī)則(collation_server )后,數(shù)據(jù)庫(kù)校驗(yàn)規(guī)則(collation_collation)默認(rèn)會(huì)繼承服務(wù)器級(jí)的。
注意:
這個(gè)只適用于在重新啟動(dòng)之后, 新建的庫(kù),已存在的庫(kù)不受影響.
同樣的, 即使庫(kù)的校驗(yàn)規(guī)則改了,已經(jīng)存在的表不受修改影響;
同理與已經(jīng)存在的列...
mysql> create database yutest0; Query OK, 1 row affected (0.00 sec) mysql> use yutest0; Database changed mysql> create table t1 (name varchar(10)); Query OK, 0 rows affected (0.01 sec) mysql> insert into t1 values('AAA'); Query OK, 1 row affected (0.00 sec) mysql> insert into t1 values('aaa'); Query OK, 1 row affected (0.01 sec) mysql> select * from t1; +------+ | name | +------+ | AAA | | aaa | +------+ 2 rows in set (0.00 sec) mysql> select * from t1 where name='aaa'; +------+ | name | +------+ | aaa | +------+ 1 row in set (0.00 sec)
可以看出,在服務(wù)器級(jí)進(jìn)行相應(yīng)的校對(duì)規(guī)則設(shè)置,查詢大小寫(xiě)敏感。
(2)當(dāng)服務(wù)器啟動(dòng)時(shí)根據(jù)有效的選項(xiàng)設(shè)置
當(dāng)啟動(dòng)mysqld時(shí),根據(jù)使用的初始選項(xiàng)設(shè)置來(lái)確定服務(wù)器字符集和校對(duì)規(guī)則。
shell> mysqld --character-set-server=latin1 --collation-server=latin1_swedish_ci
2.2數(shù)據(jù)庫(kù)級(jí)
MySQL這樣選擇數(shù)據(jù)庫(kù)字符集和數(shù)據(jù)庫(kù)校對(duì)規(guī)則:
如果指定了character set X和collate Y,那么采用字符集X和校對(duì)規(guī)則Y。
如果指定了character set X而沒(méi)有指定collate Y,那么采用character set X和character set X的默認(rèn)校對(duì)規(guī)則。
否則,采用服務(wù)器字符集和服務(wù)器校對(duì)規(guī)則。
(1)修改配置文件/etc/my.cnf
進(jìn)行了兩組測(cè)試:
1) 在[mysqld]下添加:
collation_server = utf8_bin collation_database = utf8_bin
2) 在[mysqld]下添加:
collation_database = utf8_bin
重啟實(shí)例,兩組都不能正常啟動(dòng),錯(cuò)誤信息如下:
可見(jiàn),my.cnf配置文件中不支持設(shè)置collation_database 變量。
(2)創(chuàng)建數(shù)據(jù)庫(kù)時(shí)設(shè)置數(shù)據(jù)庫(kù)校驗(yàn)規(guī)則
mysql> create database yutest default character set utf8 collate utf8_bin; Query OK, 1 row affected (0.00 sec) mysql> show variables like 'collation_%'; +----------------------+-----------------+ | Variable_name | Value | +----------------------+-----------------+ | collation_connection | utf8_general_ci | | collation_database | utf8_bin | | collation_server | utf8_general_ci | +----------------------+-----------------+ 3 rows in set (0.00 sec) mysql> select * from t1; +------+ | name | +------+ | ABC | | abc | +------+ 2 rows in set (0.00 sec) mysql> select * from t1 where name='abc'; +------+ | name | +------+ | abc | +------+ 1 row in set (0.01 sec)
可以看出,在數(shù)據(jù)庫(kù)級(jí)進(jìn)行相應(yīng)的校對(duì)規(guī)則設(shè)置,查詢大小寫(xiě)敏感。
2.3表級(jí)
MySQL按照下面的方式選擇表字符集和校對(duì)規(guī)則:
如果指定了character set X和collate Y,那么采用character set X和collate Y。
如果指定了character set X而沒(méi)有指定collate Y,那么采用character set X和character set X的默認(rèn)校對(duì)規(guī)則。
否則,采用數(shù)據(jù)庫(kù)字符集和服務(wù)器校對(duì)規(guī)則。
在創(chuàng)建表時(shí)設(shè)置表級(jí)校驗(yàn)規(guī)則:
mysql> create database yutest2; Query OK, 1 row affected (0.01 sec) mysql> use yutest2; Database changed mysql> create table t1(name varchar(10)) -> default character set utf8 collate utf8_bin; Query OK, 0 rows affected (0.01 sec) mysql> insert into t1 values('ABC'); Query OK, 1 row affected (0.00 sec) mysql> insert into t1 values('abc'); Query OK, 1 row affected (0.00 sec) mysql> show variables like 'collation_%'; +----------------------+-----------------+ | Variable_name | Value | +----------------------+-----------------+ | collation_connection | utf8_general_ci | | collation_database | utf8_general_ci | | collation_server | utf8_general_ci | +----------------------+-----------------+ 3 rows in set (0.00 sec) mysql> select * from t1; +------+ | name | +------+ | ABC | | abc | +------+ 2 rows in set (0.00 sec) mysql> select * from t1 where name='abc'; +------+ | name | +------+ | abc | +------+ 1 row in set (0.00 sec)
可以看出,在表級(jí)進(jìn)行相應(yīng)的校對(duì)規(guī)則設(shè)置,查詢大小寫(xiě)敏感。
2.4 連接級(jí)
考慮什么是一個(gè)“連接”:它是連接服務(wù)器時(shí)所作的事情??蛻舳税l(fā)送SQL語(yǔ)句,例如查詢,通過(guò)連接發(fā)送到服務(wù)器。服務(wù)器通過(guò)連接發(fā)送響應(yīng)給客戶端,例如結(jié)果集。對(duì)于客戶端連接,這樣會(huì)導(dǎo)致一些關(guān)于連接的字符集和校對(duì)規(guī)則的問(wèn)題,這些問(wèn)題均能夠通過(guò)系統(tǒng)變量來(lái)解決:
mysql> show variables like 'character%'; +--------------------------+----------------------------+ | Variable_name | Value | +--------------------------+----------------------------+ | character_set_client | utf8 | | character_set_connection | utf8 | | character_set_database | utf8 | | character_set_filesystem | binary | | character_set_results | utf8 | | character_set_server | utf8 | | character_set_system | utf8 | | character_sets_dir | /usr/share/mysql/charsets/ | +--------------------------+----------------------------+ 8 rows in set (0.00 sec)
當(dāng)查詢離開(kāi)客戶端后,在查詢中使用哪種字符集?
服務(wù)器使用character_set_client變量作為客戶端發(fā)送的查詢中使用的字符集。
服務(wù)器接收到查詢后應(yīng)該轉(zhuǎn)換為哪種字符集?
轉(zhuǎn)換時(shí),服務(wù)器使用character_set_connection和collation_connection系統(tǒng)變量。它將客戶端發(fā)送的查詢從character_set_client系統(tǒng)變量轉(zhuǎn)換到character_set_connection。
服務(wù)器發(fā)送結(jié)果集或返回錯(cuò)誤信息到客戶端之前應(yīng)該轉(zhuǎn)換為哪種字符集?
character_set_results變量指示服務(wù)器返回查詢結(jié)果到客戶端使用的字符集。包括結(jié)果數(shù)據(jù),例如列值和結(jié)果元數(shù)據(jù)(如列名)。
3. 創(chuàng)建數(shù)據(jù)庫(kù)表時(shí)大小寫(xiě)不敏感,仍然有方法在查詢時(shí)區(qū)分大小寫(xiě)
3.1 在SQL語(yǔ)句中使用collate
使用collate子句,能夠?yàn)橐粋€(gè)比較覆蓋任何默認(rèn)校對(duì)規(guī)則。collate可以用于多種SQL語(yǔ)句中,比如where,having,group by,order by,as,聚合函數(shù)。
mysql> select * from t1 where name collate utf8_bin = 'ABC'; +------+ | name | +------+ | ABC | +------+ 1 row in set (0.00 sec) mysql> select * from t1 where name = 'ABC'; +------+ | name | +------+ | ABC | | Abc | | abc | +------+ 3 rows in set (0.00 sec) mysql> select * from t1; +------+ | name | +------+ | ABC | | Abc | | abc | +------+ 3 rows in set (0.00 sec)
3.2 binary操作符
binary操作符是collate子句的一個(gè)速記符。binary 'x'等價(jià)與'x' collate y,這里y是字符集'x'二元校對(duì)規(guī)則的名字。每一個(gè)字符集有一個(gè)二元校對(duì)規(guī)則。例如,latin1字符集的二元校對(duì)規(guī)則是latin1_bin,因此,如果列a是字符集latin1,以下兩個(gè)語(yǔ)句有相同效果:
select * from t1 order by binary a; select * from t1 order by a collate latin1_bin; mysql> select * from t1 where binary name = 'ABC'; +------+ | name | +------+ | ABC | +------+ 1 row in set (0.00 sec) mysql> mysql> select * from t1 where name = 'ABC'; +------+ | name | +------+ | ABC | | Abc | | abc | +------+ 3 rows in set (0.00 sec)
相關(guān)文章
explain命令為什么可能會(huì)修改MySQL數(shù)據(jù)
這篇文章主要介紹了explain命令為什么可能會(huì)修改MySQL數(shù)據(jù),幫助大家更好的理解和使用MySQL,感興趣的朋友可以了解下2020-12-12MySQL數(shù)據(jù)庫(kù)的出錯(cuò)代碼列表
2008-01-01mysql 無(wú)法聯(lián)接常見(jiàn)故障及原因分析
這篇文章主要介紹了mysql 無(wú)法聯(lián)接常見(jiàn)故障及原因分析,本文是小編日常收集整理的,非常不錯(cuò),具有參考借鑒價(jià)值,需要的朋友可以參考下2017-11-11MYSQL如何查詢成績(jī)?yōu)榍?名的學(xué)生
這篇文章主要介紹了MYSQL如何查詢成績(jī)?yōu)榍?名的學(xué)生問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-11-11SQL實(shí)現(xiàn)LeetCode(180.連續(xù)的數(shù)字)
這篇文章主要介紹了SQL實(shí)現(xiàn)LeetCode(180.連續(xù)的數(shù)字),本篇文章通過(guò)簡(jiǎn)要的案例,講解了該項(xiàng)技術(shù)的了解與使用,以下就是詳細(xì)內(nèi)容,需要的朋友可以參考下2021-08-08mysql設(shè)置某字段不能重復(fù)問(wèn)題
這篇文章主要介紹了mysql設(shè)置某字段不能重復(fù)問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-08-08