php上傳中文文件名亂碼問題處理方案
php上傳文件是最最基礎(chǔ)的一個(gè)技術(shù)點(diǎn),但是深入進(jìn)去也有不少問題需要解決,這不,上傳中文文件后,文件名變成了亂碼。
下面是問題代碼,很簡單:
1.問題代碼
html部分:
<html>
<body>
<form action="upload_file.php" method="post"
enctype="multipart/form-data">
<label for="file">Filename:</label>
<input type="file" name="file" id="file" />
<br />
<input type="submit" name="submit" value="Submit" />
</form>
</body>
</html>
php部分:
<?php
if ($_FILES["file"]["error"] > 0)
{
echo "Return Code: " . $_FILES["file"]["error"] . "<br />";
}else
{
echo "Upload: " . $_FILES["file"]["name"] . "<br />";
echo "Type: " . $_FILES["file"]["type"] . "<br />";
echo "Size: " . ($_FILES["file"]["size"] / 1024) . " Kb<br />";
echo "Temp file: " . $_FILES["file"]["tmp_name"] . "<br />";
if (file_exists("upload/" . $_FILES["file"]["name"]))
{
echo $_FILES["file"]["name"] . " already exists. ";
}
else
{
move_uploaded_file($_FILES["file"]["tmp_name"],
"upload/" . $_FILES["file"]["name"]);
}
}
上傳了一個(gè)文件名為“測試數(shù)據(jù).txt”的文件,oh ho,文件是傳上去了,但是文件名為亂碼。
2.初試
網(wǎng)上搜索一下解決方案,將
move_uploaded_file($_FILES["file"]["tmp_name"], "upload/" . $_FILES["file"]["name"]);
改成
move_uploaded_file($_FILES["file"]["tmp_name"],"upload/" . iconv("UTF-8","gbk",$_FILES["file"]["name"]));
結(jié)果發(fā)現(xiàn)iconv函數(shù)返回值為false。
查一下函數(shù)手冊,發(fā)現(xiàn)第二個(gè)參數(shù)有特別的用法,簡單翻譯一下就是我可以在編碼的后面追加//TRANSLIT 或 //IGNORE ,前者會將無法翻譯的字符轉(zhuǎn)成最接近的字符,后者就是直接忽略不能轉(zhuǎn)化的字符。
試一下:
var_dump( iconv("UTF-8","gbk//TRANSLIT",$_FILES["file"]["name"]));
var_dump( iconv("UTF-8","gbk//IGNORE",$_FILES["file"]["name"]));
結(jié)果:
bool(false) string(4) ".txt"
也就是說中文都沒法轉(zhuǎn)化,甚至連接近的字符都沒有,看來網(wǎng)上介紹的方法也并非萬能。
3.網(wǎng)上介紹方法失敗,再嘗試
猜測一下,也許我的系統(tǒng)在創(chuàng)建中文文件的時(shí)候會亂碼,于是我將代碼改寫了一下:
move_uploaded_file($_FILES["file"]["tmp_name"], "upload/測試數(shù)據(jù).txt");
結(jié)果創(chuàng)建成功,沒有亂碼。。。也就是說不是系統(tǒng)問題。
想一下,我的php文件本身是utf8編碼的,那么
move_uploaded_file($_FILES["file"]["tmp_name"],"upload/測試數(shù)據(jù).txt");
這個(gè)語句肯定使用的是utf8編碼,那么之前上傳的文件名肯定就不是utf8編碼了,那么以下的語句肯定是錯(cuò)誤的,因?yàn)樵醋址旧砭筒皇莡tf8編碼的:
iconv("UTF-8","gbk//TRANSLIT",$_FILES["file"]["name"]);
使用函數(shù)檢查源字符串的編碼:
$e=mb_detect_encoding($text, array(‘UTF-8', ‘GBK','gb2312'));
echo $e;
結(jié)果是CP936,也就是源字符串編碼是GBK。
試一下
move_uploaded_file($_FILES["file"]["tmp_name"],"upload/" . iconv("gbk","UTF-8",$_FILES["file"]["name"]));
問題解決,不再亂碼
4.另一種解決辦法
實(shí)際上還有一種解決辦法,就是在html文件的head標(biāo)簽中間加入
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
從而使編碼保持統(tǒng)一,也就不需要再轉(zhuǎn)碼了
5.下面是結(jié)論
使用iconv函數(shù)可以解決上傳中文文件名亂碼的問題,實(shí)際上iconv能解決各種各樣的由于編碼不統(tǒng)一造成的亂碼問題。
使用iconv函數(shù)請先檢查源字符串的編碼,除非你已經(jīng)確定了源字符串的編碼。
盡量保證所有的代碼的編碼一致,萬不得已才使用iconv函數(shù)。
吐槽一下,盡量不使用中文文件名作為服務(wù)器上保存的文件名,請將文件名轉(zhuǎn)化成自己的文件名(即使是英文文件名也請轉(zhuǎn)化一下)。
相關(guān)文章
php實(shí)現(xiàn)簡單的權(quán)限管理的示例代碼
本篇文章主要介紹了php實(shí)現(xiàn)簡單的權(quán)限管理的示例代碼,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2017-08-08php array_udiff_assoc 計(jì)算兩個(gè)數(shù)組的差集實(shí)例
這篇文章主要介紹了php array_udiff_assoc 計(jì)算兩個(gè)數(shù)組的差集實(shí)例的相關(guān)資料,需要的朋友可以參考下2016-11-11ThinkPHP框架中使用Memcached緩存數(shù)據(jù)的方法
這篇文章主要介紹了ThinkPHP框架中使用Memcached緩存數(shù)據(jù)的方法,結(jié)合實(shí)例形式分析了thinkPHP框架中Memcached緩存的設(shè)置與使用相關(guān)操作技巧,需要的朋友可以參考下2018-03-03laravel框架中路由設(shè)置,路由參數(shù)和路由命名實(shí)例分析
這篇文章主要介紹了laravel框架中路由設(shè)置,路由參數(shù)和路由命名,結(jié)合實(shí)例形式分析了laravel框架中路由的設(shè)置、請求處理、映射、命名等相關(guān)操作技巧,需要的朋友可以參考下2019-11-11