將編碼從GB2312轉成UTF-8的方法匯總(從前台、程序、數據庫)


這篇文章主要介紹了將編碼從GB2312轉成UTF-8的方法匯總(從前台、程序、數據庫),需要的朋友可以參考下

一個網站如果需要國際化,就需要將編碼從GB2312轉成UTF-8,其中有很多的問題需要注意,如果沒有轉換徹底,將會有很多的編碼問題出現!
主要有五個方面:
一..HTML頁面轉UTF-8編碼問題
二.PHP頁面轉UTF-8編碼問題
三.MYSQL數據庫使用UTF-8編碼的問題
四.JS相關的UTF-8編碼問題
五.FLASH相關的UTF-8編碼問題

一.HTML頁面轉UTF-8編碼問題

1.在后,之間有中文字符的話,顯示的標題有可能是亂碼!
2.html文件編碼問題:
點擊編輯器的菜單:“文件”->“另存為”,可以看到當前文件的編碼,確保文件編碼為:UTF-8,如果是ANSI,需要將編碼改成:UTF-8。
3.HTML文件頭BOM問題:
將文件從其他的編碼轉換成UTF-8編碼時,有時候會在文件的最開始加上一個BOM標簽,在個BOM標簽可能會導致瀏覽器在顯示中文的時候出現亂碼。
刪除這個BOM標簽的方法:
1.可以用Dreamweaver打開文件,並重新保存,即可以去除BOM標簽!
2.可以用EditPlus打開文件,並在菜單“首選項”->“文件”->"UTF-8標識",設置為:“總是刪除簽名”,然后保存文件,即可以去除BOM標簽!
4.WEB服務器UTF-8編碼問題:
如果你按以上所列的步驟做了,還是有中文亂碼問題,請檢查你的所使用的WEB服務器的編碼問題
如果你使用的是Apache,請將配置文件里的:charset 設成:utf-8(這里僅列出方法,具體格式請參考apache的配置文件)。
如果你使用的是Nginx,請將nginx.conf里的:charset 設成 utf-8,具體找到 "charset gb2312;"或者類似的語句,改成:"charset utf-8;”。

二.PHP頁面轉UTF-8編碼問題

1.在代碼開始出加入一行:
header("Content-Type: text/html;charset=utf-8");
2.PHP文件編碼問題
點擊編輯器的菜單:“文件”->“另存為”,可以看到當前文件的編碼,確保文件編碼為:UTF-8,如果是ANSI,需要將編碼改成:UTF-8。
3.PHP文件頭BOM問題:
PHP文件一定不可以有BOM標簽,否則,會出現session不能使用的情況,並有類似的提示:
Warning: session_start() [function.session-start]: Cannot send session cache limiter - headers already sent
這是因為,在執行session_start() 的時候,整個頁面不能有輸出,但是當由於前PHP頁面存在BOM標簽,PHP把這個BOM標簽當成是輸出了,所以就出錯了!
所以PHP頁面一定要刪除BOM標簽
刪除這個BOM標簽的方法:
1.可以用Dreamweaver打開文件,並重新保存,即可以去除BOM標簽!
2.可以用EditPlus打開文件,並在菜單“首選項”->“文件”->"UTF-8標識",設置為:“總是刪除簽名”,然后保存文件,即可以去除BOM標簽!
4.PHP以附件形式保存文件的時候,UTF-8編碼問題:
PHP以附件形式保存文件,文件名必須是GB2312編碼,否則,如果文件名中有中文的話,將是顯示亂碼:
如果你的PHP本身是UTF-8編碼格式的文件,需要將文件名變量由UTF-8轉成GB2312:
iconv("UTF-8", "GB2312", "$filename");
5.截斷顯示文章標題時,出現亂碼或者“?”問號的問題:
一般文章標題很長的時候,會顯示一部分標題,會對文章標題進行截斷,由於一個UTF-8編碼格式的中文字符會占用3個字符寬度,截取標題的時候,有時會只截取到一個中文字符的1個字符或2字符寬度,沒截取完整,將出現亂碼或“?”問號的情況,用下面的函數截取標題,就不會有問題:

 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
function get_brief_str( $str , $max_length )
{
echo strlen ( $str ) ."
";
if ( strlen ( $str ) > $max_length )
{
$check_num = 0;
for ( $i =0; $i < $max_length ; $i ++)
{
if (ord( $str [ $i ]) > 128)
$check_num ++;
}
if ( $check_num % 3 == 0)
$str = substr ( $str , 0, $max_length ). "..." ;
else if ( $check_num % 3 == 1)
$str = substr ( $str , 0, $max_length + 2). "..." ;
else if ( $check_num % 3 == 2)
$str = substr ( $str , 0, $max_length + 1). "..." ;
}
return $str ;
}

三.MYSQL數據庫使用UTF-8編碼的問題
1.用phpmyadmin創建數據庫和數據表
創建數據庫的時候,請將“整理”設置為:“utf8_general_ci”或執行語句:

CREATE DATABASE `dbname` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;

創建數據表的時候:如果是該字段是存放中文的話,則需要將“整理”設置為:“utf8_general_ci”,
如果該字段是存放英文或數字的話,默認就可以了。
相應的SQL語句,例如:

 
1
2
3
4
5
CREATE TABLE `test` (
`id` INT NOT NULL ,
` name ` VARCHAR ( 10 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,
PRIMARY KEY ( `id` )
) ENGINE = MYISAM ;

2.用PHP讀寫數據庫
在連接數據庫之后:

$connection = mysql_connect($host_name, $host_user, $host_pass);

加入兩行:

mysql_query("set character set 'utf8'");//讀庫 
mysql_query("set names 'utf8'");//寫庫

就可以正常的讀寫MYSQL數據庫了。

四.JS相關的UTF-8編碼問題

1.JS讀Cookie的中文亂碼問題
PHP寫cookie的時候需要將中文字符進行escape編碼,否則JS讀到cookie中的中文字符將是亂碼。
但php本身沒有escape函數,我們新寫一個escape函數:

 
1
2
3
4
5
6
7
8
9
10
11
12
13
function escape( $str )
{
preg_match_all( "/[\x80-\xff].|[\x01-\x7f]+/" , $str , $r );
$ar = $r [0];
foreach ( $ar as $k => $v )
{
if (ord( $v [0]) < 128)
$ar [ $k ] = rawurlencode( $v );
else
$ar [ $k ] = "%u" .bin2hex(iconv( "UTF-8" , "UCS-2" , $v ));
}
return join( "" , $ar );
}

JS讀cookie的時候,用unescape解碼,然后就解決cookie中有中文亂碼的問題了。
2.外部JS文件UTF-8編碼問題
當一個HTML頁面或則PHP頁面包含一個外部的JS文件時,如果HTML頁面或則PHP頁面是UTF-8編碼格式的文件,外部的JS文件同樣要轉成UTF-8的文件,否則將出現,沒有包含不成功,調用函數時沒有反應的情況。
點擊編輯器的菜單:“文件”->“另存為”,可以看到當前文件的編碼,確保文件編碼為:UTF-8,如果是ANSI,需要將編碼改成:UTF-8。

五.FLASH相關的UTF-8編碼問題
FLASH內部對所有字符串,默認都是以UTF-8處理
1.FLASH讀文普通本文件(txt,html)
要將文本文件的編碼存為UTF-8
點擊編輯器的菜單:“文件”->“另存為”,可以看到當前文件的編碼,確保文件編碼為:UTF-8,如果是ANSI,需要將編碼改成:UTF-8。
2.FLASH讀XML文件
要將XML文件的編碼存為UTF-8
點擊編輯器的菜單:“文件”->“另存為”,可以看到當前文件的編碼,確保文件編碼為:UTF-8,如果是ANSI,需要將編碼改成:UTF-8。
在XML第1行寫:

<?xml version="1.0" encoding="utf-8"?>
3.FLASH讀PHP返回數據
如果PHP編碼本身是UTF-8的,直接echo就可以了。
如果PHP編碼本身是GB2312的,可以將PHP轉存成UTF-8編碼格式的文件,直接echo就可以了
如果PHP編碼本身是GB2312的,而且不允許改文件的編碼格式,用下面的語句將字符串轉換成UTF-8的編碼格式

$new_str = iconv("GB2312", "UTF-8", "$str");

再echo就可以了
4.FLASH讀數據庫(MYSQL)的數據
FLASH要通過PHP讀取數據庫中的數據,PHP本身的編碼不重要,關鍵是如果數據庫的編碼是GB2312的話,需要用下面的語句將字符串轉換成UTF-8的編碼格式。

$new_str = iconv("GB2312", "UTF-8", "$str");

5.FLASH通過PHP寫數據
一句話,FLASH傳過來的字符串是UTF-8格式的,要轉換成相應的編碼格式,再操作(寫文件、寫數據庫、直接顯示等等),還是用iconv函數轉換。
6.FLASH使用本地編碼(理論上不推薦使用)
如果想讓FLASH不使用UTF-8編碼,而是使用本地編碼。對於中國大陸地區而言,本地編碼是GB2312或GBK
AS程序內,可以添加以下代碼:

System.useCodepage = true;

那么FLASH內所有字符都是使用GB2312的編碼了,所有導入到FLASH或者從FLASH導出的數據,都應該做相應的編碼轉換。
因為使用本地編碼,會造成使用繁體中文地區的用戶產生亂碼,所以不推薦使用。

原文:http://www.jb51.net/article/74777.htm

干貨:

file_get_contents獲取字符亂碼

header("Content-Type:text/html;charset=utf-8"); 
$keyworld="這里是UTF8字符";
$keyworld=iconv("utf-8","gb2312",$keyworld);
$url = "http://www.baidu.com/wd=$keyworld";
$html = file_get_contents($url); //這里是gbk字符
$html = iconv("gb2312", "utf-8//IGNORE",$html); //轉化
echo $html;


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM