欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

nodejs和C語言插入mysql數(shù)據(jù)庫亂碼問題的解決方法

 更新時(shí)間:2017年04月14日 17:17:57   作者:村中少年  
這篇文章主要介紹了nodejs和C語言插入mysql數(shù)據(jù)庫亂碼問題,需要的朋友可以參考下

在這里記錄了nodejs過程中的一些亂碼情況,這里的亂碼主要是由于網(wǎng)頁的編碼方式與nodejs的默認(rèn)解碼方式(utf8)不一致所造成的。這一次要說一下的是在C語言和nodejs與MySQL進(jìn)行交互的時(shí)候出現(xiàn)的亂碼問題。

       1,由于爬蟲程序在多個(gè)Docker中執(zhí)行,因此我需要定期的同步每一個(gè)docker中的mysql數(shù)據(jù)到一個(gè)全局的mysql數(shù)據(jù)表中。使用nodejs進(jìn)行數(shù)據(jù)同步,出現(xiàn)中文亂碼。要知道在每一docker中的中文是不存在亂碼的。原因是nodejs默認(rèn)處理字符是utf8,而mysql默認(rèn)是latin1,畢竟是歐洲人開發(fā)的數(shù)據(jù)庫。分析如下

       命令show variables like 'char%';得到的結(jié)果如下:

+--------------------------+----------------------------+
| Variable_name | Value  |
+--------------------------+----------------------------+
| character_set_client | latin1  |
| character_set_connection | latin1  |
| character_set_database | latin1  |
| character_set_filesystem | binary  |
| character_set_results | latin1  |
| character_set_server | latin1  |
| character_set_system | latin1  |
| character_sets_dir | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+

       即在建立數(shù)據(jù)庫的時(shí)候不特別指定,則數(shù)據(jù)庫,數(shù)據(jù)表的以及數(shù)據(jù)字段的編碼格式為默認(rèn)值,而默認(rèn)值在不更改配置文件的時(shí)候是latin1(默認(rèn)安裝形式)。由于utf8是較為通用的編碼方式,因此我們將數(shù)據(jù)庫的所有編碼方式改為utf8。這里需要說明的是mysql的編碼分為好幾個(gè)層次,包括數(shù)據(jù)庫級(jí)別,數(shù)據(jù)表級(jí)別以及數(shù)據(jù)字段級(jí)別等,我這里沒有去深究這些方面,一個(gè)個(gè)去設(shè)置每個(gè)字段,每個(gè)表的編碼方式,而是把所有的編碼方式均設(shè)置為utf8。具體如下: 

      vi /etc/my.cnf修改my.cnf文件如下:

[mysqld]
datadir=/var/lib/mysql
socket=/var/lib/mysql/mysql.sock
user=mysql
default-character-set = utf8
character_set_server = utf8
[mysql]
default-character-set = utf8
[mysql.server]
default-character-set = utf8
# Disabling symbolic-links is recommended to prevent assorted security risks
symbolic-links=0
[mysqld_safe]
log-error=/var/log/mysqld.log
pid-file=/var/run/mysqld/mysqld.pid
default-character-set = utf8
[client]
default-character-set = utf8

       修改完之后,重起mysql服務(wù)service mysqld restart

       命令show variables like 'char%';再次查看編碼格式,得到的結(jié)果如下:

+--------------------------+----------------------------+
| Variable_name | Value  |
+--------------------------+----------------------------+
| character_set_client | utf8  |
| character_set_connection | utf8  |
| character_set_database | utf8  |
| character_set_filesystem | binary  |
| character_set_results | utf8  |
| character_set_server | utf8  |
| character_set_system | utf8  |
| character_sets_dir | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+

       可以看到所有的編碼格式都會(huì)變成utf8,至此在建立數(shù)據(jù)庫和數(shù)據(jù)表,數(shù)據(jù)字段的時(shí)候如果不特別指定,那么則會(huì)采用默認(rèn)的編碼方式,即現(xiàn)在的utf8。

       2,雖然編碼格式從latin1變成了utf8,但是我這里還是遇到如下的問題。

Specified key was too long; max key length is 1000 bytes

       意思是key值長度大于1000個(gè)字節(jié)了,這里面的key值長度指的是定義key值時(shí)候的長度和乘以編碼格式字節(jié)數(shù),而不指實(shí)際長度。同時(shí)由于取1utf8=3字節(jié)(這個(gè)我是看別人都是這么說的,具體取多少我這邊不確定),因此將其和乘以3之后就大于1000個(gè)字節(jié)了。原先latin1是沒問題的(取的是1)。 

       解決辦法即就是(1),縮減key值的定義長度。(2),不使用utf8編碼。(3),因?yàn)槟J(rèn)DB engine 是MyIsAm,把其換成innodb。我使用方式(3),然后錯(cuò)誤得以消除。

       3,這個(gè)時(shí)候又出現(xiàn)了如下問題:

ERROR: ER_TOO_LONG_KEY: Specified key was too long; max key length is 767 bytes

       這個(gè)問題的原因還是utf8所導(dǎo)致的,在latin1編碼格式下,我設(shè)置了VARCHAR (512)類型為主鍵是沒有問題的,而utf8則不行,是由于utf8編碼取的是3字節(jié),也就說,只能容納256個(gè)utf8編碼格式的VARCHAR。因此定義的時(shí)候定義為VARCHAR (255)問題得以消除,或者換一種數(shù)據(jù)類型。 

       4,至此我使用nodejs進(jìn)行數(shù)據(jù)庫的讀寫都是沒有問題的,但是我在使用C 語言的時(shí)候,發(fā)現(xiàn)插入utf8編碼的中文,仍然顯示的是亂碼。原因可能由多種,這里面我說一下我遇到的兩種情況。首先確認(rèn)本地系統(tǒng)的默認(rèn)編碼方式,使用locale命令進(jìn)行查看(Linux),通常情況應(yīng)該是utf8,為了保險(xiǎn)期間,我在C語言中加入了如下的代碼顯示指定編碼方式

#include <locale.h>
setlocale(LC_ALL, "en_US.UTF-8");

       這個(gè)時(shí)候,C語言執(zhí)行mysql_query插入數(shù)據(jù)的時(shí)候,數(shù)據(jù)庫仍然顯示亂碼。解決方法如下:

mysql_query(g_pMyConn, "set character set utf8");
mysql_query(g_pMyConn, g_strSqlStatement)

       即在執(zhí)行數(shù)據(jù)庫插入命令前,多加上一行顯示的說明使用utf8方式執(zhí)行。

       由于nodejs插入的時(shí)候沒有C語言的問題,我就簡單構(gòu)想了一下如下原因,純屬個(gè)人猜測:

       由于C語言使用的是mysql官方提供的api接口,而且mysql是由于歐洲人開發(fā)的,開始的時(shí)候沒想到會(huì)應(yīng)用那么廣泛,因此使用了latin1默認(rèn)編碼,隨著mysql應(yīng)用的人越來越多,因此在支持其他編碼的時(shí)候就需要在原來的接口上打補(bǔ)丁,因此就會(huì)出現(xiàn)上面顯示的指定編碼格式,并沒有做到接口和數(shù)據(jù)庫默認(rèn)編碼能夠自動(dòng)保持一致的情況。 

       對(duì)于nodejs來說,連接數(shù)據(jù)庫的行為會(huì)由nodejs進(jìn)行封裝,考慮的就相對(duì)全面,因此沒有C 語言中的問題。

       最后我發(fā)現(xiàn)DB engine 從MyIsAm換成innodb,讀取速度好變慢了,不知是啥原因,知道的麻煩告知一聲。

以上所述是小編給大家介紹的nodejs和C語言插入mysql數(shù)據(jù)庫亂碼問題,希望對(duì)大家有所幫助,如果大家有任何疑問請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!

相關(guān)文章

最新評(píng)論