欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

mysql數(shù)據(jù)校驗(yàn)過程中的字符集問題處理

 更新時(shí)間:2014年05月13日 16:10:15   作者:  
在日常應(yīng)用中,我們經(jīng)常會(huì)遇到在不同的字符集的數(shù)據(jù)庫直接進(jìn)行數(shù)據(jù)的導(dǎo)入導(dǎo)出操作,針對這個(gè)問題,我們來進(jìn)行討論下

場景:
主庫DB:utf8字符集
備庫DB:gbk字符集

需求:
校驗(yàn)主備數(shù)據(jù)是否一致,并且修復(fù)

校驗(yàn)過程:
設(shè)置主庫連接為utf8,設(shè)置備庫連接為gbk,分別進(jìn)行查詢,將返回的的結(jié)果集按記錄逐字段比較。

顯示結(jié)果:
原本相同的漢字字符,數(shù)據(jù)校驗(yàn)認(rèn)為不一致。

原因分析:
對于主庫而已,由于建立連接的字符集為UTF8,則返回的漢字字符編碼為UTF8格式;對于備庫而言則是GBK格式,而程序中通過字符串比較函數(shù)strcasecmp進(jìn)行比較,顯然不同的字符集編碼,相同的字符有不同的二進(jìn)制,因此結(jié)果肯定不會(huì)相等。

進(jìn)一步分析:
那么對于這種情況,建立連接應(yīng)該采用哪種字符集呢?GBK or UTF8。其實(shí)選擇任何一種字符集都是OK的,只要是訪問主庫和備庫的字符集保持一致即可,唯一的區(qū)別在于,若選擇的字符集與客戶端的字符集不一致,可能導(dǎo)致無法正常顯示字符,即字符顯示為亂碼。

我們以客戶端的字符集為例,詳細(xì)說說三種情況:【這里的客戶端可以認(rèn)為是SecureCRT】
備注:綠色框代表DB字符集,黃色框代表連接字符集,橙色框代表客戶端
第一種情況:

就是上述的情況,主庫返回字符的GBK編碼,備庫返回字符的UTF8編碼,因此進(jìn)行字段比對,則會(huì)出現(xiàn)誤差。

第二種情況:

訪問主庫的連接不變,備庫連接由UTF8變?yōu)镚BK,因此進(jìn)行返回時(shí),數(shù)據(jù)庫會(huì)將DB的字符集轉(zhuǎn)為GBK返回給客戶端,那么對于客戶端而已,相同字符都是通過GBK編碼表示,因此二進(jìn)制相等,校驗(yàn)結(jié)果正確。

第三種情況:

   訪問主庫和備庫的連接都是UTF8,因此對于主庫而已,返回給客戶端的字符編碼由GBK轉(zhuǎn)為UTF8,此時(shí)主庫和備庫都是UTF8編碼,校驗(yàn)結(jié)果正確。但由于客戶端實(shí)質(zhì)是GBK編碼方式顯示,因此返回的漢字字符都是亂碼,但不影響校驗(yàn)結(jié)果的正確性。

修復(fù):

      既然選擇與主備庫任一一個(gè)相同的字符集去訪問,都不會(huì)影響校驗(yàn)結(jié)果的正確性,那么影響修復(fù)呢?由于UTF8的編碼范圍比GBK編碼范圍要大,因此若采用GBK連接訪問UTF8編碼DB,有可能出現(xiàn)部分字符GBK不能表示的情況。

我們拿第二種情況說明,此時(shí)主庫為GBK,備庫為UTF8,使用GBK訪問UTF8。假設(shè)存在UTF8轉(zhuǎn)為GBK過程中部分字符丟失,這時(shí)候主備庫肯定是不一致的,因?yàn)榇嬖诓糠肿址鸊BK無法表示。 假設(shè)修復(fù)語句如下:

Update  t set c1=master_value  where  c1=slave_value  and id=?

其中t表示表名,id是主鍵表示某一行,master_value為主庫c1列的值,slave_value為備庫c1列的值。此時(shí),slave_value由于UTF8轉(zhuǎn)為GBK已經(jīng)丟失,因此語句執(zhí)行最終影響0行記錄,無法修復(fù)。

 

結(jié)論:

客戶端訪問兩個(gè)不同字符集庫進(jìn)行數(shù)據(jù)校驗(yàn)時(shí),連接采用表示范圍更大的字符集。比如我們常用的字符集表示范圍如下:

Latin<gb2312<gbk<utf8

 

附:mysql客戶端與服務(wù)器通信時(shí)字符集編碼轉(zhuǎn)換流程

相關(guān)參數(shù):

– character_set_client:客戶端來源數(shù)據(jù)使用的字符集

– character_set_connection:連接層字符集

– character_set_results:查詢結(jié)果字符集

– character_set_database:當(dāng)前選中數(shù)據(jù)庫的默認(rèn)字符集

– character_set_system:系統(tǒng)元數(shù)據(jù)(字段名等)字符集

 1.客戶端請求服務(wù)器

1)將client的字符集轉(zhuǎn)為connection字符集

2)將connection字符集轉(zhuǎn)為DB內(nèi)部的字符集

 

 2.服務(wù)器返回結(jié)果給客戶端

1)將DB內(nèi)部字符集轉(zhuǎn)為connection字符集

2)將connection字符集轉(zhuǎn)為character_set_results字符集

 

3.設(shè)置字符集命令:set names 字符編碼

指定客戶端與服務(wù)器通信的字符集,包括請求與返回。

SET NAMES 'x'  等價(jià)于:

SET character_set_client = x;

SET character_set_results = x;

SET character_set_connection = x;

附圖:

相關(guān)文章

  • mysql查看鎖表及殺進(jìn)程問題

    mysql查看鎖表及殺進(jìn)程問題

    這篇文章主要介紹了mysql查看鎖表及殺進(jìn)程問題,具有很好的參考價(jià)值,希望對大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-07-07
  • MySQL全文索引、聯(lián)合索引、like查詢、json查詢速度哪個(gè)快

    MySQL全文索引、聯(lián)合索引、like查詢、json查詢速度哪個(gè)快

    這篇文章主要介紹了MySQL全文索引、聯(lián)合索引、like查詢、json查詢速度大比拼,通過實(shí)例代碼截圖的形式給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-02-02
  • 關(guān)于MySQL主從復(fù)制的幾種復(fù)制方式總結(jié)

    關(guān)于MySQL主從復(fù)制的幾種復(fù)制方式總結(jié)

    這篇文章主要給大家介紹了關(guān)于MySQL主從復(fù)制的幾種復(fù)制方式,文中通過示例代碼介紹的非常詳細(xì),對大家學(xué)習(xí)或者使用MySQL具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-08-08
  • jQuery 綁定事件的方式總結(jié)

    jQuery 綁定事件的方式總結(jié)

    這篇文章主要介紹了jQuery 綁定事件的方式總結(jié)的相關(guān)資料,這里整理了幾種方法,需要的朋友可以參考下
    2016-11-11
  • 詳解MySQL中的分組查詢與連接查詢語句

    詳解MySQL中的分組查詢與連接查詢語句

    這篇文章主要介紹了MySQL中的分組查詢與連接查詢語句,同時(shí)還介紹了一些統(tǒng)計(jì)函數(shù)的用法,需要的朋友可以參考下
    2016-03-03
  • MySQL 全文索引使用指南

    MySQL 全文索引使用指南

    在 MySQL 中,我們經(jīng)常使用 WHERE 條件用于進(jìn)行值的相等比較、范圍過濾。然而,我們也會(huì)使用關(guān)鍵字進(jìn)行搜索,這個(gè)基于搜索值與其他值的相關(guān)性來進(jìn)行過濾。MySQL全文檢索即用于這種場景。本篇將介紹如何使用全文檢索。
    2021-05-05
  • MySQL的線程池原理學(xué)習(xí)教程

    MySQL的線程池原理學(xué)習(xí)教程

    這篇文章主要介紹了MySQL的線程池原理學(xué)習(xí)教程,包括線程池的函數(shù)調(diào)用與關(guān)鍵接口等重要知識,非常推薦!需要的朋友可以參考下
    2015-11-11
  • 詳解MySQL是如何解決幻讀的

    詳解MySQL是如何解決幻讀的

    這篇文章主要介紹了MySQL是如何解決幻讀的,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-04-04
  • MySQL查詢隨機(jī)數(shù)據(jù)的4種方法和性能對比

    MySQL查詢隨機(jī)數(shù)據(jù)的4種方法和性能對比

    從MySQL隨機(jī)選取數(shù)據(jù)也是我們最常用的一種發(fā)發(fā),其最簡單的辦法就是使用”O(jiān)RDER BY RAND()”,本文介紹了包括ORDER BY RAND()的4種獲取隨機(jī)數(shù)據(jù)的方法,并分析了各自的優(yōu)缺點(diǎn)。
    2014-04-04
  • 關(guān)于MySql的kill命令詳解

    關(guān)于MySql的kill命令詳解

    這篇文章主要介紹了關(guān)于MySql的kill命令詳解,不知道你在使用 MySQL 的時(shí)候,有沒有遇到過這樣的現(xiàn)象:使用了 kill 命令,卻沒能斷開這個(gè)連接,今天我們就來講一講這個(gè)問題,需要的朋友可以參考下
    2023-05-05

最新評論