MySQL的中文UTF8亂碼問題
從MySQL支持Unicode后,為了與時俱進,我們的web程序也開始考慮用UTF8了。其實UTF8也用了好幾年了,程序基本能跑,沒什么大問題,但是數(shù)據(jù)倒換的時候,總是遇到不爽的事情。
【問題現(xiàn)象】
網(wǎng)頁xxx.php用EditPlus另存為UTF8格式,MySQL在my.ini里設置default-character-set=utf8,建表時加了CREATE TABLE `xxx ` (myname varchar(255)) ENGINE=MyISAM DEFAULT CHARSET=utf8,用xxx.php執(zhí)行insert/update/select出來的都是中文,貌似沒問題,但是用phpMyAdmin看select是亂碼,用第三方工具軟件(如SQLyog)看select也是亂碼,mysqldump也是亂碼,很不爽。當然,如果你建表的時候,選擇了binary/varbinary/blob類型,不會發(fā)現(xiàn)亂碼,因為指定的是二進制保存,MySQL保存數(shù)據(jù)時就沒有編碼的概念了。
【查找問題】
雖然在my.ini里設置default-character-set=utf8,但是執(zhí)行以下命令時有新發(fā)現(xiàn):
mysql> SHOW VARIABLES LIKE 'character%'; +----------------------------------------+------------------------- | Variable_name | Value +----------------------------------------+------------------------- | character_set_client | latin1 | character_set_connection | latin1 | character_set_database | utf8 | character_set_filesystem | binary | character_set_results | latin1 | character_set_server | utf8 | character_set_system | utf8 | character_sets_dir | D:\mysql\share\charsets\ +----------------------------------------+------------------------- 8 rows in set (0.00 sec)
mysql> SHOW VARIABLES LIKE 'collation_%'; +---------------------------------------+------------------ | Variable_name | Value +---------------------------------------+------------------ | collation_connection | latin1_swedish_ci | collation_database | utf8_general_ci | collation_server | utf8_general_ci +--------------------------------------+------------------ 3 rows in set (0.00 sec) |
發(fā)現(xiàn)Value列里面不全是utf8,仍然有部分是latin1,比如其中的client和connection。那網(wǎng)頁xxx.php的工作過程就是這樣的啦:從xxx.php頁面上輸入漢字,因為xxx.php是UTF8編碼的,所以xxx.php以UTF8格式轉(zhuǎn)換輸入的漢字,然后以UTF8提交給mysql,但是mysql的client和connection都是latin1的,而表是UTF8的,所以mysql存儲時,先將xxx.php提交的漢字,轉(zhuǎn)成latin1的格式,再轉(zhuǎn)成UTF8字符格式存在表中。如果此時我們用第三方軟件或者phpMyAdmin去select查看此表,而表中存儲的數(shù)據(jù)是被latin1過的UTF8字符,出來的時候是以UTF8格式取的,當然看起來時亂碼了。解決方法就是讓所有過程都是UTF8的就可以了。
【解決問題】
1、從my.ini下手
[client] default-character-set=utf8 [mysql] default-character-set=utf8 [mysqld] default-character-set=utf8 |
以上3個section都要加default-character-set=utf8,平時我們可能只加了mysqld一項。
然后重啟mysql,執(zhí)行
mysql> SHOW VARIABLES LIKE 'character%';
mysql> SHOW VARIABLES LIKE 'collation_%';
確保所有的Value項都是utf8即可。
2、建表時加utf8,表字段的Collation可加可不加,不加時默認是utf8_general_ci了。
CREATE TABLE `tablename4` ( `id` int(11) NOT NULL AUTO_INCREMENT, `varchar1` varchar(255) DEFAULT NULL, `varbinary1` varbinary(255) DEFAULT NULL, PRIMARY KEY (`id`) ) ENGINE=MyISAM DEFAULT CHARSET=utf8 |
3、網(wǎng)頁xxx.php保存時選擇utf8編碼,頁頭最好加上
header('conten-type:text/html;charset=utf-8');
在執(zhí)行CRUD操作前先執(zhí)行一下
mysql_query("set names utf8");
測試代碼xxx.php如下:
<?php header('conten-type:text/html;charset=utf-8'); mysql_connect("localhost", "root", "password") or die("Could not connect: " . mysql_error()); mysql_select_db("test"); mysql_query("set names utf8"); $str = "CHN 軟件開發(fā)有限公司,JPN ソフトウェア開発株式會社,KOR 소프트웨어 개발 유한 공사,RUS Суд программного обеспечения".time(); $sql = "insert into tablename4 (varchar1, varbinary1 ) values ('".$str."','".$str."')"; echo $sql."<hr>"; mysql_query($sql);
$result = mysql_query("SELECT id, varchar1 ,varbinary1 FROM tablename4"); while ($row = mysql_fetch_array($result, MYSQL_BOTH)) { printf ("ID: %s , varchar1: %s, varbinary1: %s<br>", $row[0], $row["varchar1"], $row["varbinary1"]); }
mysql_free_result($result); ?> |
如此設置之后,無論是在php頁面插入任何utf8字符,在php頁面里取出來的,在phpMyAdmin里取出來的,在mysql的第三方客戶端軟件里取出來的,都是一樣的漢字了,不會再發(fā)現(xiàn)亂碼,mysqldump出來的也是漢字。OK,問題解決。
【另】在中文windows系統(tǒng)下,在cmd.exe里運行mysql.exe字符終端,不能使用上面的規(guī)則,因為默認情況下,中文windows系統(tǒng)cmd.exe里的代碼頁是cp936即GBK,不能顯示全部UTF8字符,所以在字符終端里看到亂碼是正常現(xiàn)象,不要奇怪,這個問題在類Unix系統(tǒng)的shell終端里可以解決的。
相關文章

MySQL中的聚簇索引、非聚簇索引、聯(lián)合索引和唯一索引詳細介紹

教你使用VS?Code的MySQL擴展管理數(shù)據(jù)庫的方法