request和response的中文亂碼問題


  

  request亂碼指的是:瀏覽器向服務器發送的請求參數中包含中文字符, 服務器獲取到的請求參數的值是亂碼;

  response亂碼指的是:服務器向瀏覽器發送的數據包含中文字符,瀏覽器中顯示的是亂碼;

亂碼產生的原因:

  不管是request亂碼還是response亂碼,其實都是由於客戶端(瀏覽器)跟服務器端采用的編碼格式不一致造成的。

以request亂碼為例:瀏覽器向服務器發送請求,因為瀏覽器與服務器之間的通信實質上是socket流,所以要先將請求參數(字符)轉換成字節,也就是編碼過程,服務器接收到請求參數后進行解碼(字節轉字符),然后封裝到request對象中。如果客戶端的編碼與服務器端的解碼不統一,就會導致通過request獲取到的請求參數的值是亂碼。

解決亂碼方式:

一、response亂碼
    服務器發給瀏覽器的數據默認是按照ISO-8859-1編碼,瀏覽器接收到數據后按照默認的字符集進行解碼后顯示,如果瀏覽器的默認解碼字符集不是ISO-8859-1,就出現亂碼。
    對於response亂碼,只需要在服務器端指定一個編碼字符集,然后通知瀏覽器按照這個字符集進行解碼就可以了。有三種方式:
 
    方式1:response.setCharacterEncoding("utf-8”);//設置服務器端的編碼,默認是ISO-8859-1;該方法必須在response.getWriter()之前進行設置
                 response.setHeader("contentType", "text/html; charset=utf-8”);//通知瀏覽器服務器發送的數據格式是text/html,並要求瀏覽器使用utf-8進行解碼。
 
    方式2:response.setContentType("text/html;charset=utf-8”);//等同於response.setHeader("contentType", "text/html; charset=utf-8”);它其實會覆蓋
      response.setCharacterEncoding("utf-8”) ,在開發中只需要設置response.setContentType("text/html;charset=utf-8”)就可以了。意思是通知瀏覽器服務器發送的數據                  格式是text/html,服務器采用utf-8編碼,並要求瀏覽器使用utf-8進行解碼。
 
    方式3:response.setCharacterEncoding("utf-8”);//設置服務器端的編碼為utf-8
                 response.getWriter().println("<meta http-equiv='Content-Type' content='text/html; charset=utf-8'>”);//要求瀏覽器使用utf-8進行解碼
               
 可以看出,第二種方式是最簡便的,這也是我們在開發中最常使用的方式。
 
二、request亂碼
       從瀏覽器發起的訪問方式有三種:在地址欄直接輸入URL訪問、點擊頁面中的超鏈接訪問、提交表單訪問。第一種訪問方式瀏覽器默認將參數按照utf-8進行編碼,后面兩種訪問方式瀏覽器將參數按照當前頁面的顯示編碼進行編碼。所以對於request亂碼,只需要在服務器端設置相應的解碼格式即可。由於訪問方式不同,瀏覽器對參數的編碼格式也不同,為了方便處理,通過超鏈接和表單的訪問也規定必須是utf-8格式,即顯示當前頁面的編碼也要使用utf-8,這樣瀏覽器將統一使用utf-8對參數進行編碼。
       在服務器端,通過request.setCharacterEncoding("utf-8”)即可設置服務器的解碼為utf-8(默認是ISO-8859-1),但是它只對請求體里面的參數有效;如果參數跟在請求行中的uri后邊,它就無能為力了。因此請求方式不同,解決亂碼的方案也不同。
 
 1、post方式
          post方式屬於表單提交,參數存在於請求體中,通過request.setCharacterEncoding("utf-8”)即可解決亂碼。
   
 2、get方式
         get方式提交的參數會跟在請求行中的uri后邊,服務器按照默認的iso-8859-1進行解碼,這時候解決亂碼有兩種辦法:
         辦法一:修改服務器端對uri參數的默認編碼
          在tomcat的server.xml中,設置<Connector ….>元素的屬性URIEncoding="UTF-8”即可。(默認沒有設置此屬性)
         例如:<Connector connectionTimeout="20000" port="8080" protocol="HTTP/1.1" redirectPort="8443" URIEncoding="UTF-8”/>
          注意:
    1、設置<Connector ….>元素的屬性useBodyEncodingForURI=“true”,意思是請求體和uri使用相同的編碼格式。
    通過設置這兩個屬性,既可以解決get方式的亂碼,又可以解決     post方式的亂碼。
    2、通過修改server.xml指定服務器對get和post統一按照utf-8解碼,要求tomcat管理下的所有web應用都要使用utf-8編碼,
    即所有的jsp、html頁面都使用utf-8編碼。比如 JSP頁面的頭信息是這樣的:
 
<%@ page language="java" contentType="text/html; charset=utf-8"
    pageEncoding="utf-8"%>
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"]]>
<html]]>
<head]]>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8"]]>
<title]]>Insert title here</title]]>
</head]]>
           辦法二:逆向操作
                  參數從瀏覽器到服務器,經過客戶端utf-8編碼,服務器端iso-8859-1解碼,最終成為亂碼。那我們將亂碼進行相反的編解碼,即可得到正常的參數值。
                例如:String name = request.getParameter("name”);//得到亂碼    
                          name = new String(name.getBytes("iso-8859-1"),"utf-8”);//得到正常的name值(post和get都適用)
          注意:name.getBytes();如果不指定編碼,默認按照gb2312進行編碼。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM