MySQL中文亂碼問題的解決
更新時間:2006年12月11日 00:00:00 作者:
1. MySQL 4.1 在文字上有很大改進,它有了 Character Set 與 Collation 的慨念。
2. 在 MySQL 4.0 ,一般的程式都會將文字以拉丁文 ( latin) 來儲存,就算我們輸入中文字,結(jié)果仍是放在以拉丁文設置的文字欄里頭,這對 MySQL 4.0 與以 MySQL 4.0 為基楚的程式來說,并不會有問題。
3. 可是 MySQL 4.1 的系統(tǒng)編碼是預設用 UTF-8 的,當要 restore MySQL 4.0 的 backup 檔到 MySQL 4.1 時,亂碼就出現(xiàn)了。原因在于 MySQL 4.1 將 latin 碼轉(zhuǎn)換過來,而后轉(zhuǎn)換是并不完全完美的,這導致了出現(xiàn)少量文字出現(xiàn)亂碼現(xiàn)象。
4. 要解決這亂碼問題并不難。首先,在 MySQL 4.0 備份時,先將所有文字欄變成 binary 類型,然后進行正常備份。第二步,可在 MySQL 4.1 里將剛才的備份 restore。最后,將較早前所變更到 binay 類型的文字欄,再次復原到文字類型。這樣中文編碼的問題就應該可以完全解決。
5. 將文字欄變更到 binay 類型時,必需設定 binary 欄的長度大過或等于 (>=) 文字欄的長度,否則資料會失去。
6. 另外,經(jīng)這樣升級的 MySQL 數(shù)據(jù)庫,在 MySQL 4.1 里將會正常工作,就算是怎樣 backup 與 restore 都不會再有亂碼問題。
作者: MySQL 發(fā)布日期: 2005-12-14
mysql4.1是比較煩人,支持多語言的細化設置,再加上phpmyadmin2.6也比較笨,默認就是改不動的utf8,怎么弄都亂碼。
好了,廢話少說,我們來一步步解決這個問題:
1.修改/etc/my.cnf文件,改成這樣:
[mysqld]
datadir=/var/lib/mysql
socket=/var/lib/mysql/mysql.sock
default-character-set=utf8
[mysql.server]
user=mysql
basedir=/var/lib
[mysqld_safe]
err-log=/var/log/mysqld.log
pid-file=/var/run/mysqld/mysqld.pid
注意:就是加入了一句default-character-set=utf8。
2./etc/init.d/mysqld restart 重新啟動mysql;
3.打開phpmyadmin,選擇lang為"Chines simplifies(zh-utf-8)",選擇"MySQL 連接校對"為"utf8_general_ci "點“顯示 MySQL 的運行信息”--“變量”,可以看到:
character set client utf8 utf8
character set connection utf8 utf8
character set database utf8 utf8
character set results utf8 utf8
character set server utf8 utf8
character set system utf8 utf8
collation connection utf8_general_ci utf8_general_ci
collation database utf8_general_ci utf8_general_ci
collation server utf8_general_ci utf8_general_ci
從這里可以看到character全部變成utf8了。
有人要問,為什么都要改成utf8呢?改成GB2312不行嗎?
解釋如下:
我也不想改成utf8,只是phpmyadmin2.6在mysql4.1的時候只會用utf8,連其他頁面的charset也都是utf8,改成gb2312一定會亂碼,我們只能湊phpmyadmin了。
只有在mysql3.23的時候,phpmyadmin才會多一個gb2312的頁面charset,這時候是正常的。
3.將以前的mysql3的庫文件導入mysql4.1的庫
有兩種情況:
一是從phpmyadmin上導入,這時候你要注意的是在選擇庫文件的頁面左下腳有個“文件的字符集:”,默認是utf8,要改成gb2312,否則導進去亂碼;
二是在linux下導入,這時候你需要先在庫文件的頭部加一行:
SET NAMES 'gb2312'; 注意最后也是;號,別漏了。
然后執(zhí)行mysql -u用戶名 -p密碼 xxx.sql > 庫名
導入完成以后再用phpmyadmin打開看,里面的中文字就是正確的。
4.從mysql4.1里導出庫文件
一.用phpmyadmin導出
導出倒是問題不大,如果phpmyadmin的瀏覽頁面里顯示的中文是正常的,那么導出肯定也是正常的
二.在linux上導出
如果用mysqldump導出出現(xiàn)了亂碼也沒有關系,可以運行iconv來轉(zhuǎn)換一下
iconv -c -f UTF-8 -t GB2312 庫文件名 > 新的gb2312的庫文件名
綜上所述,你要注意:
1。盡量在需要導入的庫文件的開頭加入SET NAMES 'gb2312';告訴mysql你要導入的是一個gb2312的文件;
2??赡苣阈枰@個:
SET NAMES 'utf8';
在登陸到mysql后用,把character的一些默認參數(shù)改到utf8上,有時可以減少一些困擾,不過也不是必須的。
在mysql上使用:
SHOW VARIABLES LIKE 'character_set_%';
用來查看當前的狀態(tài)。
3.如果出現(xiàn)亂碼也不要怕,一是你要注意留存原有的備份,二是用iconv來進行轉(zhuǎn)化。
在正常使用之前注意做導入導出的測試,確保萬無一失。
最后加一句:www.quicklinux.org原創(chuàng)文章,轉(zhuǎn)載請注明出處。呵呵
郵件:support@quicklinux.org
作者: MySQL 發(fā)布日期: 2005-12-14
我升級了MYSQL到4.1.2,phpmyadmin用的是2.6.2。數(shù)據(jù)表里面有中文的字段中文都變成了亂碼,導出數(shù)據(jù)也是亂碼。我用以前的2.5.7沒有問題,想問一下,應該在phpmyadmin的那個文件里改哪個設置一下才能顯示出來的是正常的中文字?
和字符相關的變量中這幾個和sql很有關系:
character_set_client
character_set_connection
character_set_results
此外就是數(shù)據(jù)庫中對相應字段設置的charact set,如果沒有對字段設置,缺省是table的charact set,table也沒有指定則缺省使用database的。
上面3個變量的作用是這樣的,client表示客戶端發(fā)送過來的字符集,results表示發(fā)送到客戶端的字符集(這兩個分開是因為發(fā)送過來和發(fā)送過去的不一定是同一個客戶端),connection則在客戶端和數(shù)據(jù)庫起一個連接作用。
具體是這樣:比如我在mysql命令行設置client為gbk,connection為utf8,results為gbk,數(shù)據(jù)庫為big5,
當我發(fā)送一個insert語句的時候,這個語句作為gbk代碼,先轉(zhuǎn)為utf8代碼(connection),再轉(zhuǎn)為big5(database)插入數(shù)據(jù)庫。
而運行一個select語句的時候,從數(shù)據(jù)庫得到的結(jié)果則相反的過程,由big5轉(zhuǎn)為utf8,再轉(zhuǎn)為gbk,你得到gbk的結(jié)果。
因此最主要的是讓client和results和你使用的客戶端一致。比如你的網(wǎng)頁是utf8編碼,你就要設置這兩個為utf8。
而在mysql命令行的時候,我用的是2000,需要設置為gbk
而我們用的set names XXX,實際上就是同時設置這3個變量為XXX。
在這樣的情況下,我們可以把一個數(shù)據(jù)庫中的不同表或不同字段設為不同的字符集,只要上面3個設置正確,就可以在數(shù)據(jù)庫中同時使用不同的字符集。
注意要保證你的數(shù)據(jù)庫中的字符已經(jīng)使用了正確的字符集,比如如果一開始你設置錯誤,插入數(shù)據(jù)后,本身數(shù)據(jù)的編碼就是不正確的,然后即使設置改回來,也不可能得到正確的顯示了。
還有一個是編碼互相之間的兼容性,如果一個字符在gbk中有,在utf8中沒有,那么在gbk-》utf8-》gbk的過程中,它就變成了“?”
再說一下具體解決的辦法。
首先要指定你的升級后的database及table及field的character set,一般來說我們用gb2312或者utf8的,如果不同時使用多種編碼,只要指定database就可以,可以在建庫的sql語句加上相應的character set,在phpMyAdmin里也可以修改。
然后是導入舊數(shù)據(jù)。首先要確定自己的數(shù)據(jù)文件的編碼。如果用phpMyAdmin導入,在界面上有文件編碼的選項,一定要和數(shù)據(jù)文件的編碼一致。
如果從mysql的命令行導入,就要自己設置上面說到的3個變量,set names xxx。
使用其它的客戶端程序一樣要注意。
這樣就可以讓舊數(shù)據(jù)轉(zhuǎn)入新數(shù)據(jù)庫后的編碼才是正確的,如果這一步錯了,后面不可能得到正確的顯示。
然后是自己的程序,在連接后就可以執(zhí)行一次set names xxx,根據(jù)你的網(wǎng)頁編碼而定。
這樣基本就可以保證編碼正確了。
你很有可能是導入的數(shù)據(jù)編碼已經(jīng)不對了。
轉(zhuǎn)自:http://www.zhaodaola.org/blog/p/mysql-luanma.php
MYSQL數(shù)據(jù)庫默認語言為瑞典語, 現(xiàn)有一GB2312字符的數(shù)據(jù)庫.
結(jié)構(gòu)OK. 為什么內(nèi)容是亂碼? 不重裝數(shù)據(jù)庫有辦法解決碼?
從MySQL 4.1開始引入的多語言支持確實很棒,而且一些特性已經(jīng)超過了其他的數(shù)據(jù)庫系統(tǒng)。不過我在測試過程中發(fā)現(xiàn)使用適用于MySQL 4.1之前的PHP語句操作MySQL數(shù)據(jù)庫會造成亂碼,即使是設置過了表字符集也是如此。我讀了一下新的MySQL在線手冊中第十章"Character Set Support"后終于找到了解決方法并測試通過。
MySQL 4.1的字符集支持(Character Set Support)有兩個方面:字符集(Character set)和排序方式(Collation)。對于字符集的支持細化到四個層次: 服務器(server),數(shù)據(jù)庫(database),數(shù)據(jù)表(table)和連接(connection)。
查看系統(tǒng)的字符集和排序方式的設定可以通過下面的兩條命令:
mysql> SHOW VARIABLES LIKE 'character_set_%';
+--------------------------+----------------------------+
| Variable_name | Value |
+--------------------------+----------------------------+
| character_set_client | latin1 |
| character_set_connection | latin1 |
| character_set_database | latin1 |
| character_set_results | latin1 |
| character_set_server | latin1 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+
7 rows in set (0.00 sec)
mysql> SHOW VARIABLES LIKE 'collation_%';
+----------------------+-------------------+
| Variable_name | Value |
+----------------------+-------------------+
| collation_connection | latin1_swedish_ci |
| collation_database | latin1_swedish_ci |
| collation_server | latin1_swedish_ci |
+----------------------+-------------------+
3 rows in set (0.00 sec)
上面列出的值就是系統(tǒng)的默認值。(很奇怪系統(tǒng)怎么默認是latin1的瑞典語排序方式)...
當我們按照原來的方式通過PHP存取MySQL數(shù)據(jù)庫時,就算設置了表的默認字符集為utf8并且通過UTF-8編碼發(fā)送查詢,你會發(fā)現(xiàn)存入數(shù)據(jù)庫的仍然是亂碼。問題就出在這個connection連接層上。解決方法是在發(fā)送查詢前執(zhí)行一下下面這句:
SET NAMES 'utf8';
它相當于下面的三句指令:
SET character_set_client = utf8;
SET character_set_results = utf8;
SET character_set_connection = utf8;
再試試看,正常了吧?^_^ Enjoy!
具體講
在你的查詢前加一行:
mysql_query("SET NAMES 'gb2312';",$this->con);
真應該把手冊仔細看一遍.
相關文章
MySQL5.7 group by新特性報錯1055的解決辦法
項目中本來使用的是mysql5.6進行開發(fā),切換到5.7之后,突然發(fā)現(xiàn)原來的一些sql運行都報錯,錯誤編碼1055,錯誤信息和sql_mode中的“only_full_group_by“有關。下面小編給大家分享下解決辦法2016-12-12MYSQL跨服務器同步數(shù)據(jù)經(jīng)驗分享
這篇文章主要介紹了MYSQL跨服務器同步數(shù)據(jù)詳細過程,需要的朋友可以參考下2014-03-03解決MySQL因不能創(chuàng)建 PID 導致無法啟動的方法
這篇文章主要給大家介紹了關于解決MySQL因不能創(chuàng)建 PID 導致無法啟動的方法,文中通過示例代碼介紹的非常詳細,對大家具有一定的參考學習價值,需要的朋友們下面跟著小編一起來學習學習吧。2017-06-06