欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

MySQL字符集和排序規(guī)則詳解(推薦)

 更新時(shí)間:2024年08月29日 10:11:47   作者:寂夜了無痕  
MySQL中,字符集和排序規(guī)則在處理文本數(shù)據(jù)時(shí)起著至關(guān)重要的作用,本文將詳細(xì)介紹 MySQL中的字符集和排序規(guī)則,感興趣的朋友跟隨小編一起看看吧

前言

MySQL中,字符集和排序規(guī)則在處理文本數(shù)據(jù)時(shí)起著至關(guān)重要的作用,本文將詳細(xì)介紹 MySQL中的字符集和排序規(guī)則。

簡介

字符集(Character Set):

  • 字符集定義了數(shù)據(jù)庫中可以存儲(chǔ)的字符的集合。在MySQL中,常見的字符集包括utf8、utf8mb4、latin1等。
  • utf8mb4字符集是用于在MySQL中存儲(chǔ)Unicode字符集(包括Emoji等特殊字符)的一種字符集,提供更廣泛的字符支持。

排序規(guī)則(Collation):

  • 排序規(guī)則定義了如何對字符進(jìn)行比較和排序。不同的排序規(guī)則會(huì)影響字符比較的結(jié)果。
  • 排序規(guī)則由字符集和排序方式組成,例如utf8_general_ci、utf8mb4_unicode_ci等。

字符集

常見字符集 以及 說明

  • utf8:

UTF-8 是一種變長字符編碼,可以表示世界上幾乎所有的字符。utf8是MySQL中常用的字符集,但在處理某些特殊字符(如 Emoji)時(shí)可能會(huì)有問題。

  • utf8mb4:

utf8mb4 是 utf8 的超集,支持存儲(chǔ)更廣泛的字符范圍(包括 Emoji 等)。通常用于支持更廣泛的語言和符號(hào)。

  • latin1:

Latin1 是一種較老的字符集,適用于大多數(shù)西歐語言和部分其他語言的字符。

  • latin2:

Latin2 是擴(kuò)展的 Latin1 字符集,支持中東歐語言中的額外字符。

  • cp1251:

CP1251 是常用于俄語的字符集。

  • utf16:

UTF-16 是一種固定長度字符編碼,用于表示 Unicode 字符。每個(gè)字符占兩個(gè)字節(jié)。

  • utf32:

UTF-32 是一種固定長度字符編碼,用于表示 Unicode 字符。每個(gè)字符占四個(gè)字節(jié)。

  • binary:

Binary 字符集以二進(jìn)制方式存儲(chǔ)數(shù)據(jù),并且對存儲(chǔ)的數(shù)據(jù)進(jìn)行大小寫敏感的比較。

  • ascii:

ASCII 字符集只支持 ASCII 字符集中的字符,范圍較窄。

大多數(shù)選擇 utf8mb4 字符集 同時(shí)也支持表情存儲(chǔ)

排序規(guī)則

常見的排序規(guī)則

以字符集 utf8mb4 為例

  • utf8mb4_bin:這是一個(gè)大小寫敏感的二進(jìn)制排序規(guī)則,直接根據(jù)字符的二進(jìn)制值進(jìn)行比較,區(qū)分大小寫。
  • utf8mb4_croatian_ci:克羅地亞語的大小寫不敏感排序規(guī)則,適用于克羅地亞語文本的比較和排序。
  • utf8mb4_czech_ci:捷克語的大小寫不敏感排序規(guī)則,適用于捷克語文本的比較和排序。
  • utf8mb4_danish_ci:丹麥語的大小寫不敏感排序規(guī)則,適用于丹麥語文本的比較和排序。
  • utf8mb4_esperanto_ci:世界語的大小寫不敏感排序規(guī)則,適用于世界語文本的比較和排序。
  • utf8mb4_estonian_ci:愛沙尼亞語的大小寫不敏感排序規(guī)則,適用于愛沙尼亞語文本的比較和排序。
  • utf8mb4_general_ci:這是一個(gè)通用的大小寫不敏感排序規(guī)則,適用于大多數(shù)情況下的文本比較和排序。
  • utf8mb4_german2_ci:德語的大小寫不敏感排序規(guī)則,適用于德語文本的比較和排序。
  • utf8mb4_hungarian_ci:匈牙利語的大小寫不敏感排序規(guī)則,適用于匈牙利語文本的比較和排序。
  • utf8mb4_icelandic_ci:冰島語的大小寫不敏感排序規(guī)則,適用于冰島語文本的比較和排序。
  • utf8mb4_latvian_ci:拉脫維亞語的大小寫不敏感排序規(guī)則,適用于拉脫維亞語文本的比較和排序。
  • utf8mb4_lithuanian_ci:立陶宛語的大小寫不敏感排序規(guī)則,適用于立陶宛語文本的比較和排序。
  • utf8mb4_persian_ci:波斯語的大小寫不敏感排序規(guī)則,適用于波斯語文本的比較和排序。
  • utf8mb4_polish_ci:波蘭語的大小寫不敏感排序規(guī)則,適用于波蘭語文本的比較和排序。
  • utf8mb4_roman_ci:羅馬尼亞語的大小寫不敏感排序規(guī)則,適用于羅馬尼亞語文本的比較和排序。
  • utf8mb4_romanian_ci:羅馬尼亞語的大小寫不敏感排序規(guī)則,適用于羅馬尼亞語文本的比較和排序。
  • utf8mb4_sinhala_ci:僧伽羅語的大小寫不敏感排序規(guī)則,適用于僧伽羅語文本的比較和排序。
  • utf8mb4_slovak_ci:斯洛伐克語的大小寫不敏感排序規(guī)則,適用于斯洛伐克語文本的比較和排序。
  • utf8mb4_slovenian_ci:斯洛文尼亞語的大小寫不敏感排序規(guī)則,適用于斯洛文尼亞語文本的比較和排序。
  • utf8mb4_spanish2_ci:西班牙語的大小寫不敏感排序規(guī)則,適用于西班牙語文本的比較和排序。
  • utf8mb4_spanish_ci:西班牙語的大小寫不敏感排序規(guī)則,適用于西班牙語文本的比較和排序。
  • utf8mb4_swedish_ci:瑞典語的大小寫不敏感排序規(guī)則,適用于瑞典語文本的比較和排序。
  • utf8mb4_turkish_ci:土耳其語的大小寫不敏感排序規(guī)則,適用于土耳其語文本的比較和排序。
  • utf8mb4_unicode_520_ci:Unicode 5.20版本的大小寫不敏感排序規(guī)則,適用于支持 Unicode 5.20字符集的文本比較和排序。
  • utf8mb4_unicode_ci:Unicode的大小寫不敏感排序規(guī)則,適用于支持Unicode字符集的文本比較和排序。
  • utf8mb4_vietnamese_ci:越南語的大小寫不敏感排序規(guī)則,適用于越南語文本的比較和排序。

比較常用的應(yīng)該就是以下4個(gè)

  • utf8mb4_general_ci: 不區(qū)分大小寫,一般用于一般文本比較,適合非敏感數(shù)據(jù)。
  • utf8mb4_unicode_ci: 不區(qū)分大小寫,支持多語言,適合需要多語言支持的應(yīng)用。
  • utf8mb4_bin: 區(qū)分大小寫,按照二進(jìn)制順序比較,適合敏感數(shù)據(jù)比較。

選擇排序規(guī)則的考慮因素:

  • 大小寫敏感性:

_ci(Case Insensitive):不區(qū)分大小寫。
_cs(Case Sensitive):區(qū)分大小寫。 選擇對大小寫敏感的排序規(guī)則,如utf8mb4_bin。

  • 多語言支持:

_unicode_ci:提供對多語言的支持,適用于需要處理不同語言字符的場景。

  • 排序方式:

_ci(Case Insensitive):按照不區(qū)分大小寫的方式進(jìn)行排序。
_bin(Binary):按照二進(jìn)制方式進(jìn)行排序,嚴(yán)格按照字符的編碼值進(jìn)行比較。

  • 性能考慮:

不同排序規(guī)則對性能有影響,一些排序規(guī)則可能比其他規(guī)則更快。
選擇合適的排序規(guī)則有助于優(yōu)化查詢性能。

實(shí)踐

我們來測試下 區(qū)分大小寫和不區(qū)分大小寫的排序規(guī)則 查詢有何不同

新建表

新建bs表 同時(shí) name 排序規(guī)則設(shè)置為utf8mb4_general_ci 大小寫不敏感

CREATE TABLE `bs` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `name` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=3 DEFAULT CHARSET=utf8mb4

測試數(shù)據(jù)寫入

INSERT INTO `test`.`bs` (`id`,`name`) VALUES ('1','a');
INSERT INTO `test`.`bs` (`id`,`name`) VALUES ('2','A');
INSERT INTO `test`.`bs` (`id`,`name`) VALUES ('3','aA');
INSERT INTO `test`.`bs` (`id`,`name`) VALUES ('4','Aa');
INSERT INTO `test`.`bs` (`id`,`name`) VALUES ('5','AA');
INSERT INTO `test`.`bs` (`id`,`name`) VALUES ('6','aa');

排序規(guī)則 不區(qū)分大小寫 數(shù)據(jù)測試

select * from bs where name= 'A';

select * from bs where name= 'a';

select * from bs where name= 'aa';

select * from bs where name= 'AA';

select * from bs where name= 'aA';

select * from bs where name= 'Aa';

select * from bs where name LIKE '%A';

select * from bs where name LIKE '%a';

select * from bs where name= '%A%';

select * from bs where name= '%a%';

排序規(guī)則 區(qū)分大小寫 數(shù)據(jù)測試

修改表name 字段為 排序規(guī)則為 utf8mb4_bin

ALTER TABLE `bs`
	MODIFY COLUMN `name` VARCHAR(255) CHARACTER SET utf8mb4 COLLATE  utf8mb4_bin NOT NULL  ;
select * from bs where name= 'A';

select * from bs where name= 'a';

select * from bs where name= 'aa';

select * from bs where name= 'AA';

select * from bs where name= 'aA';

select * from bs where name= 'Aa';

select * from bs where name LIKE '%A';

select * from bs where name LIKE '%a';

select * from bs where name LIKE '%A%';

select * from bs where name LIKE '%a%';

總結(jié)

可以看到在排序規(guī)則區(qū)分大小寫和不區(qū)分大小寫 對SQL查詢的結(jié)果 影響還是比較大的。

所以在選擇字符集時(shí),需要考慮使用的語言、特殊字符的需求以及數(shù)據(jù)存儲(chǔ)的具體情況。確保所選字符集能夠覆蓋項(xiàng)目中的所有字符需求,并選擇合適的排序規(guī)則以確保數(shù)據(jù)的正確比較和排序。

到此這篇關(guān)于MySQL字符集和排序規(guī)則詳解的文章就介紹到這了,更多相關(guān)MySQL字符集和排序規(guī)則內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • MySQL中year()和month()函數(shù)解析與輸出示例詳解

    MySQL中year()和month()函數(shù)解析與輸出示例詳解

    這篇文章主要介紹了MySQL中year()和month()函數(shù)解析與輸出,通過本文,我們詳細(xì)了解了MySQL中year()和month()函數(shù)的底層邏輯,它們能夠從日期或日期時(shí)間類型的數(shù)據(jù)中提取年份和月份,需要的朋友可以參考下
    2023-07-07
  • MySQL優(yōu)化之如何查找SQL效率低的原因

    MySQL優(yōu)化之如何查找SQL效率低的原因

    這篇文章主要介紹了MySQL優(yōu)化之如何查找SQL效率低的原因 ,需要的朋友可以參考下
    2014-05-05
  • MySQL數(shù)據(jù)庫的shell腳本自動(dòng)備份

    MySQL數(shù)據(jù)庫的shell腳本自動(dòng)備份

    這篇文章主要介紹了MySQL數(shù)據(jù)庫的shell腳本自動(dòng)備份的相關(guān)資料,網(wǎng)站或應(yīng)用的后臺(tái)都有備份數(shù)據(jù)庫的功能按鈕,但需要去手工執(zhí)行。我們需要一種安全的,每天自動(dòng)備份的方法需要的朋友可以參考下
    2017-03-03
  • 一文學(xué)習(xí)MySQL?意向共享鎖、意向排他鎖、死鎖

    一文學(xué)習(xí)MySQL?意向共享鎖、意向排他鎖、死鎖

    這篇文章主要介紹了MySQL?意向共享鎖、意向排他鎖、死鎖,包括InnoDB表級(jí)鎖,意向共享鎖和意向排他鎖及操作方法,本文給大家介紹的非常詳細(xì),需要的朋友可以參考下
    2022-03-03
  • Mysql?InnoDB中B+樹索引使用注意事項(xiàng)

    Mysql?InnoDB中B+樹索引使用注意事項(xiàng)

    這篇文章主要為大家介紹了Mysql?InnoDB中B+樹索引的注意事項(xiàng),有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2022-05-05
  • 深入理解MySQL數(shù)據(jù)類型的選擇優(yōu)化

    深入理解MySQL數(shù)據(jù)類型的選擇優(yōu)化

    這篇文章主要介紹了深入理解MySQL數(shù)據(jù)類型的選擇優(yōu)化,MySQL數(shù)據(jù)類型是定義列中可以存儲(chǔ)什么數(shù)據(jù)以及該數(shù)據(jù)實(shí)際怎樣存儲(chǔ)的基本規(guī)則,正確的選擇數(shù)據(jù)庫字段的字段類型對于數(shù)據(jù)庫性能有很大的影響
    2022-08-08
  • JDBC如何連接mysql

    JDBC如何連接mysql

    這篇文章主要介紹了JDBC如何連接mysql問題,具有很好的參考價(jià)值,希望對大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2024-04-04
  • MySql 5.7.17免安裝配置教程詳解

    MySql 5.7.17免安裝配置教程詳解

    這篇文章給大家詳細(xì)介紹了MySql 5.7.17免安裝配置教程,首先大家需要先下載mysql 5.7.17 的安裝包,然后解壓,具體配置過程大家通過本文一起學(xué)習(xí)吧
    2017-03-03
  • MySQL數(shù)據(jù)備份、還原、數(shù)據(jù)庫遷移以及表的導(dǎo)出和導(dǎo)入

    MySQL數(shù)據(jù)備份、還原、數(shù)據(jù)庫遷移以及表的導(dǎo)出和導(dǎo)入

    作為流行的開源數(shù)據(jù)庫管理系統(tǒng),MySQL的使用者眾多,為了維護(hù)數(shù)據(jù)安全性,數(shù)據(jù)備份是必不可少的,下面這篇文章主要給大家介紹了關(guān)于MySQL數(shù)據(jù)備份、還原、數(shù)據(jù)庫遷移以及表的導(dǎo)出和導(dǎo)入的相關(guān)資料,需要的朋友可以參考下
    2022-11-11
  • windows系統(tǒng)mysql5.7.18安裝圖文教程

    windows系統(tǒng)mysql5.7.18安裝圖文教程

    這篇文章主要為大家詳細(xì)介紹了windows系統(tǒng)下mysql5.7.18安裝圖文教程,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-03-03

最新評論