php數(shù)據(jù)庫(kù)讀出亂碼是說(shuō)明原因
一般來(lái)說(shuō),亂碼的出現(xiàn)有2種原因,首先是由于編碼(charset)設(shè)置錯(cuò)誤,導(dǎo)致瀏覽器以錯(cuò)誤的編碼來(lái)解析,從而出現(xiàn)了滿屏亂七八糟的“天書”,其次是文件被以錯(cuò)誤的編碼打開,然后保存,比如一個(gè)文本文件原先是GB2312編碼的,卻以UTF-8編碼打開再保存。要解決上述亂碼問(wèn)題,首先需要知道開發(fā)中哪些環(huán)節(jié)涉及到了編碼:
1、文件編碼:指的是頁(yè)面文件(.html,.php等)本身是以何種編碼來(lái)保存的。記事本和Dreamweaver在打開頁(yè)面時(shí)候會(huì)自動(dòng)識(shí)別文件編碼因而不太會(huì)出問(wèn)題。而ZendStudio卻不會(huì)自動(dòng)識(shí)別編碼,它只會(huì)根據(jù)首選項(xiàng)的配置固定以某種編碼打開文件,如果工作時(shí)候一不注意,用錯(cuò)誤編碼打開文件,做了修改之后一保存,亂碼就出現(xiàn)了。
2、頁(yè)面申明編碼:在HTML代碼HEAD里面,可以用《meta http-equiv=“Content-Type” content=“text/html; charset=”XXX“ /》(這句一定要寫在《title》XXX《/title》前面,否則會(huì)導(dǎo)致頁(yè)面一片空白(僅限IE+PHP))來(lái)告訴瀏覽器網(wǎng)頁(yè)采用了什么編碼,目前中文網(wǎng)站開發(fā)中主要用的是GB2312和UTF-8兩種編碼。
3、數(shù)據(jù)庫(kù)連接編碼:指的是進(jìn)行數(shù)據(jù)庫(kù)操作時(shí)候以哪種編碼與數(shù)據(jù)庫(kù)傳輸數(shù)據(jù),這里需要注意的是不要與數(shù)據(jù)庫(kù)本身的編碼混淆,比如MySQL內(nèi)部默認(rèn)是latin1編碼,也就是說(shuō)Mysql是以latin1編碼來(lái)存儲(chǔ)數(shù)據(jù),以其他編碼傳輸給Mysql的數(shù)據(jù)會(huì)被轉(zhuǎn)換成latin1編碼。
知道了WEB開發(fā)中哪些地方涉及到了編碼,也就知道了亂碼產(chǎn)生的原因:上述3項(xiàng)編碼設(shè)置不一致,由于各種編碼絕大部分是兼容ASCII的,所以英文符號(hào)不會(huì)出現(xiàn),中文就倒霉了。下面是一些常見的錯(cuò)誤情況與解決:
1、數(shù)據(jù)庫(kù)采用UTF8編碼,而頁(yè)面申明編碼是GB2312,這是最常見的產(chǎn)生亂碼的原因。這時(shí)候在PHP腳本里面直接SELECT數(shù)據(jù)出來(lái)的就是亂碼,需要在查詢前先使用:
mysql_query(”SET NAMES GBK“);
或mysql_query(”SET NAMES GB2312“);
來(lái)設(shè)定MYSQL連接編碼,保證頁(yè)面申明編碼與這里設(shè)定的連接編碼一致(GBK是GB2312的擴(kuò)展)。如果頁(yè)面是UTF-8編碼的話,可以用:
mysql_query(”SET NAMES UTF8“);
注意是UTF8而不是一般用的UTF-8。假如頁(yè)面申明的編碼與數(shù)據(jù)庫(kù)內(nèi)部編碼一致可以不設(shè)定連接編碼。
注:事實(shí)上MYSQL的數(shù)據(jù)輸入輸出比上面講的更復(fù)雜一些,MYSQL配置文件my.ini中定義了2個(gè)默認(rèn)編碼,分別是[client]里的default-character-set和[mysqld]里的default-character-set來(lái)分別設(shè)定默認(rèn)時(shí)候客戶端連接和數(shù)據(jù)庫(kù)內(nèi)部所采用的編碼。我們上面指定的編碼其實(shí)是MYSQL客戶端連接服務(wù)器時(shí)候的命令行參數(shù)character_set_client,來(lái)告訴MYSQL服務(wù)器接受到的客戶端數(shù)據(jù)是什么編碼的,而不是采用默認(rèn)編碼。
2、頁(yè)面申明編碼與文件本身編碼不一致,這種情況很少發(fā)生,因?yàn)槿绻幋a不一致美工做頁(yè)面時(shí)候在瀏覽器看到的就是亂碼了。更多時(shí)候是發(fā)布以后修改一些小BUG,以錯(cuò)誤編碼打開頁(yè)面然后保存導(dǎo)致的?;蛘呤怯媚承〧TP軟件直接在線修改文件,比如CuteFTP,由于軟件編碼配置錯(cuò)誤而導(dǎo)致轉(zhuǎn)換錯(cuò)了編碼。
3、一些租用虛擬主機(jī)的朋友,明明上述3項(xiàng)編碼都設(shè)置正確了還是有亂碼。比方說(shuō)網(wǎng)頁(yè)是GB2312編碼的,IE等瀏覽器打開卻總是識(shí)別成UTF-8,網(wǎng)頁(yè)HEAD里面已經(jīng)申明是GB2312了,手動(dòng)修改瀏覽器編碼為GB2312后頁(yè)面顯示正常。產(chǎn)生原因是服務(wù)器Apache設(shè)定了服務(wù)器全局的默認(rèn)編碼,在httpd.conf里面加了AddDefaultCharset UTF-8。這時(shí)候服務(wù)器會(huì)首先發(fā)送HTTP頭給瀏覽器,其優(yōu)先級(jí)比頁(yè)面里申明編碼高,自然瀏覽器就識(shí)別錯(cuò)了。解決辦法有2個(gè),請(qǐng)管理員在配置文件自己的虛機(jī)里加上一條AddDefaultCharset GB2312來(lái)覆蓋全局配置,或者在自己目錄的.htaccess里配置。
php數(shù)據(jù)庫(kù)讀出亂碼的解決方法
從后臺(tái)讀取數(shù)據(jù)時(shí),通常會(huì)出現(xiàn)亂碼情況,比如“漢字”變成“?”等,造成這種情況的原因通常是編碼設(shè)置不對(duì),解決方法如下:
第一種方法:在php中添加如下代碼,將編碼格式設(shè)為“utf-8”,代碼如下:
header(“Content-Type: text/html; charset=UTF-8”);
第二種方法:在php中添加另外一行代碼,同樣用來(lái)轉(zhuǎn)碼,代碼如下:
$conn = mysqli_connect($servername, $username, $password, $mysqlname);
$conn-》query(“SET NAMES utf8”);
該種情況是先創(chuàng)建鏈接,之后再轉(zhuǎn)碼。
另外,在使用數(shù)據(jù)庫(kù)時(shí),直接手動(dòng)(非代碼)建表,通常會(huì)在表中輸入漢字時(shí),瀏覽時(shí)無(wú)法顯示或顯示為“?”,造成這種情況的原因也是編碼問(wèn)題,解決方案如下:
在建表或建庫(kù)時(shí),表和庫(kù)的編碼格式一定要統(tǒng)一,設(shè)置成:“utf8_general_ci”,如下圖:
要解決亂碼問(wèn)題,首先必須弄清楚自己數(shù)據(jù)庫(kù)用什么編碼。如果沒(méi)有指明,將是默認(rèn)的latin1。
我們用得最多的應(yīng)該是這3種字符集 gb2312,gbk,utf8。
那么我們?nèi)绾稳ブ付〝?shù)據(jù)庫(kù)的字符集呢?下面也gbk為例
【在MySQL Command Line Client創(chuàng)建數(shù)據(jù)庫(kù)】
mysql》 CREATE TABLE `mysqlcode` (
-》 `id` TINYINT( 255 ) UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY ,
-》 `content` VARCHAR( 255 ) NOT NULL
-》 ) TYPE = MYISAM CHARACTER SET gbk COLLATE gbk_chinese_ci;
Query OK, 0 rows affected, 1 warning (0.03 sec)
mysql》 desc mysqlcode;
| Field | Type | Null | Key | Default | Extra |
| id | tinyint(255) unsigned | NO | PRI | | auto_increment |
| content | varchar(255) | NO | | | |
2 rows in set (0.02 sec)
其中后面的TYPE = MYISAM CHARACTER SET gbk COLLATE gbk_chinese_ci;
就是指定數(shù)據(jù)庫(kù)的字符集,COLLATE (??保?,讓mysql同時(shí)支持多種編碼的數(shù)據(jù)庫(kù)。
當(dāng)然我們也可以通過(guò)如下指令修改數(shù)據(jù)庫(kù)的字符集
alter database da_name default character set ‘charset’。
客戶端以 gbk格式發(fā)送 ,可以采用下述配置:
SET character_set_client=‘gbk’
SET character_set_connection=‘gbk’
SET character_set_results=‘gbk’
這個(gè)配置就等價(jià)于 SET NAMES ‘gbk’。
現(xiàn)在對(duì)剛才創(chuàng)建的數(shù)據(jù)庫(kù)操作
mysql》 use test;
Database changed
mysql》 insert into mysqlcode values(null,‘php愛好者’);
ERROR 1406 (22001): Data too long for column ‘content’ at row 1
沒(méi)有指定字符集為gbk,插入時(shí)出錯(cuò)
mysql》 set names ‘gbk’;
Query OK, 0 rows affected (0.02 sec)
指定字符集為 gbk
mysql》 insert into mysqlcode values(null,‘php愛好者’);
Query OK, 1 row affected (0.00 sec)
插入成功
mysql》 select * from mysqlcode;
| id | content |
| 1 | php愛好著 |
1 row in set (0.00 sec)
在沒(méi)有指定字符集gbk時(shí)讀取也會(huì)出現(xiàn)亂碼,如下
mysql》 select * from mysqlcode;
| id | content |
| 1 | php??? |
1 row in set (0.00 sec)
【在phpmyadmin創(chuàng)建數(shù)據(jù)庫(kù),并指定字符集】
表類型根據(jù)自己需要選,這里選MyISAM(支持全文檢索);
整理選擇 gbk_chinese_ci 也就是gbk字符集
gbk_bin 簡(jiǎn)體中文, 二進(jìn)制。gbk_chinese_ci 簡(jiǎn)體中文, 不區(qū)分大小寫。
在剛才創(chuàng)建的數(shù)據(jù)庫(kù)插入數(shù)據(jù)庫(kù)
為什么呢?是因?yàn)閿?shù)據(jù)庫(kù)為gbk字符集,而我們操作時(shí)沒(méi)有指定為gbk
回到數(shù)據(jù)庫(kù)首頁(yè)
可以看到 mysql 連接校對(duì)默認(rèn)的latin1_bin。我們將其改為gbk_chinese_ci
【解決php讀取數(shù)據(jù)庫(kù)亂碼】
仍以數(shù)據(jù)庫(kù)mysqlcode為例
《?php
$conn = mysql_connect(“l(fā)ocalhost”,“root”,“89973645”);
mysql_query(“set names ‘gbk’”);//這就是指定數(shù)據(jù)庫(kù)字符集,一般放在連接數(shù)據(jù)庫(kù)后面就系了
mysql_select_db(“test”);
$sql = “select * from mysqlcode”;
$result = mysql_query($sql,$conn);
?。俊?/p>
《head》
《meta http-equiv=“Content-Type” content=“text/html; charset=gb2312” /》
《title》mysql 字符編碼《/title》
《/head》
《body》
《table width=“300” height=“32” border=“1” align=“center” cellpadding=“0” cellspacing=“0”》
《tr》
《td width=“71” align=“center”》id《/td》
《td width=“229” align=“center”》內(nèi)容《/td》
《/tr》
《?php while($row = mysql_fetch_assoc($result)){
echo “
《tr》
《td align=/”center/“》”.$row[‘id’]。“《/td》
《td》”.$row[‘content’]?!啊?td》
《/tr》”;
}?》
《/table》
《/body》
《/html》
《?php mysql_free_result($result);?》
你數(shù)據(jù)庫(kù)用什么編碼,在對(duì)數(shù)據(jù)庫(kù)操作之前就set names ‘你的編碼’;
評(píng)論