如何解決php中文字符亂碼問題

發(fā)布時間:2024-01-28
php中文字符亂碼的解決辦法:1、改mysql配置文件“my.ini”或“my.cnf”;2、在需要做數(shù)據(jù)庫操作的php程序前加入語句“mysql_query("set names '編碼'");”;3、將服務(wù)器編碼集設(shè)置為“utf-8”。
php中文亂碼原因及解決辦法分析
php網(wǎng)頁的編碼
1.如果欲使用gb2312編碼,那么php要輸出頭:header("content-type:text/html;charset=gb2312");,靜態(tài)頁面添加,所有文件的編碼格式為ansi,可用記事本打開,另存為選擇編碼為 ansi,覆蓋源文件。
2.如果欲使用utf-8編碼,那么php要輸出頭:header("content-type:text/html;charset=utf-8");,靜態(tài)頁面添加,所有文件的編碼格式為utf-8。保存為utf-8可能會有點麻煩,一般utf-8文件開頭會有bom,如果使用session就會出問題,可用editplus來保存,在editplus中,工具->參數(shù)選擇->文件->utf-8簽名,選擇總是刪除,再保存就可以去掉bom信息了。
3.php本身不是 unicode 的,所有substr之類的函數(shù)得改成mb_substr(需要裝 mbstring 擴展);或者用 iconv 轉(zhuǎn)碼。
php與mysql的數(shù)據(jù)交互
php與數(shù)據(jù)庫的編碼應(yīng)一致
1.修改mysql配置文件my.ini或my.cnf,mysql 最好用 utf-8 編碼
[mysql] default-character-set=utf8 [mysqld] default-character-set=utf8 default-storage-engine=innodb 在[mysqld]下加入: default-collation=utf8_bin init_connect='set names utf8'2.在需要做數(shù)據(jù)庫操作的php程序前加mysql_query("set names '編碼'");,編碼和php編碼一致,如果 php編碼是 gb2312 那 mysql 編碼就是 gb2312,如果是utf-8那 mysql 編碼就是 utf8,這樣插入或檢索數(shù)據(jù)時就不會出現(xiàn)php中文亂碼了。
關(guān)于編碼
1、字符集:
在計算機底層中數(shù)據(jù)存儲的都是二進制數(shù)據(jù),要想獲取真正有意義的字符,就必須讓二進制數(shù)據(jù)與每一個字符對應(yīng)起來,這種對應(yīng)關(guān)系就形成了一張編碼表。
常用字符集:
iso-8859-1 拉丁碼表 latin,表示西歐語言,使用一個字節(jié)即8位表示數(shù)據(jù)。
gb2312 簡體中文碼表。包含6000-7000中文和符號。用兩個字節(jié)表示。兩個字節(jié)都是開頭為1,都為負數(shù)。
gbk 目前最常用的中文碼表,2萬的中文和符號。用兩個字節(jié)表示數(shù)據(jù)。
unicode 國際標準碼,無論是什么文字,都用兩個字節(jié)存儲。
utf-8 基于unicode,一個字節(jié)就可以存儲數(shù)據(jù),不用兩個字節(jié)存儲,而且這個碼表更加的標準化,在每一個字節(jié)頭加入了編碼信息。
(linux 默認使用的 iso-8859-1,win32默認使用的gb2312)
2、編碼和解碼
編碼: 將字符轉(zhuǎn)換成在字符集中對應(yīng)的編碼
解碼: 在字符集中查找出編碼對應(yīng)的字符
中文在網(wǎng)絡(luò)中的傳輸過程
1、以java為例,eclipse默認使用 utf-8 編碼集,tomcat 服務(wù)器默認使用 iso-8859-1編碼集,瀏覽器一般默認使用 gbk 編碼集。
程序與服務(wù)器之間以字符傳輸,服務(wù)器與瀏覽器之間以字節(jié)傳輸。
2、中文傳輸過程:
瀏覽器中的中文字符—–>進行編碼—–>服務(wù)器—–>進行解碼—–>程序;
程序中的中文字符—–>服務(wù)器—–>進行解碼—–>瀏覽器—–>編碼進行顯示
3、亂碼產(chǎn)生原因以解決方式:
(1)、瀏覽器中的中文字符以 gbk 進行編碼,以字節(jié)流傳輸?shù)椒?wù)器,服務(wù)器再以 iso-8859-1進行解碼,以字符的形式傳輸給程序。
因為 iso-8859-1 編碼集不支持中文字符,所有解碼后的字符都是西歐字符,把這些字符傳輸給程序就產(chǎn)生了亂碼;
針對這個原因,只要把服務(wù)器的編碼集設(shè)置為 utf-8 即可:
request.setcharacterencoding("utf-8");但這種方法只能用于post請求方式,因為設(shè)置只會作用于請求體中的內(nèi)容,如果是get請求方式,可用先解碼再編碼的方式:
byte[] buffer = request.getparameter("word").getbytes("iso-8859-1"); //進行編碼string newstr = new string(buffer,"utf-8"); //進行解碼(2)、程序中的中文字符原樣傳輸?shù)椒?wù)器,服務(wù)器要先對中文字符進行編碼再傳輸給瀏覽器,但因為 iso-8859-1 編碼集不支持中文字符,所以在字符集中查找不到對應(yīng)的編碼,編碼后就變成了問號,傳輸給了瀏覽器并顯示;
針對這種情況,要進行兩次設(shè)置:
response.setcharacterencoding("utf-8");//將服務(wù)器編碼集設(shè)置為utf-8response.setcontenttype("text/html;charset=utf-8"); //將瀏覽器編碼集設(shè)置為utf-8實際上第二行設(shè)置已經(jīng)包含了對服務(wù)器的設(shè)置,所以通常只要寫第二句代碼即可。
更多相關(guān)知識,請訪問php中文網(wǎng)!
上一個:蒸汽電磁閥對生產(chǎn)線的作用與必要性
下一個:農(nóng)業(yè)智能小型氣象站多少錢@寒潮資訊

聚氯化鋁
RTT034121BTP現(xiàn)貨庫存,最新價格
勞動合同法脫密期協(xié)議工資怎么計算
德國stauff流量計stauff傳感器smk20-m8x1-pa-c6f
城鎮(zhèn)職工基本醫(yī)療保險是什么意思
第九屆中國科技城國際科技博覽會時間-地點
智能運維管理系統(tǒng)平臺BDMS
供應(yīng)魯賓斯紅葉石楠容器苗
聚球體模型的建立(其林貝爾QL-902使用)
一般電腦配置清單,電腦配置清單及價格表5000左右
十八禁 网站在线观看免费视频_2020av天堂网_一 级 黄 色 片免费网站_绝顶高潮合集Videos