這里先寫幾個大家容易搞混的編碼設置代碼:
在jsp代碼中的頭部往往有這兩行代碼
pageEncoding是jsp文件本身的編碼
contentType的charset是指服務器發送給客戶端時的內容編碼
JSP要經過兩次的“編碼”,第一階段會用pageEncoding,第二階段會用utf-8,第三階段就是由Tomcat出來的網頁, 用的是contentType。
如果pageEncoding屬性存在,那么JSP頁面的字符編碼方式就由pageEncoding決定,
否則就由contentType屬性中的charset決定,如果charset也不存在,JSP頁面的字符編碼方式就采用
默認的ISO-8859-1。
還有一種是在服務端接受參數的編碼:
response和request的setCharacterEncoding 區別
request.setCharacterEncoding("utf-8");
response.setContentType("text/html;charset=utf-8");
request.setCharacterEncoding():是設置從request中取得的值或從數據庫中取出的值。
指定后可以通過getParameter()則直接獲得正確的字符串,如果不指定,則默認使用iso8859-1編碼。值得注意的是在執行setCharacterEncoding()之前,不能執行任何getParameter()。而且,該指定只對POST方法有效,對GET方法無效。分析原因,應該是在執行第一個getParameter()的時候,java將會按照編碼分析所有的提交內容,而后續的getParameter()不再進行分析,所以setCharacterEncoding()無效。而對於GET方法提交表單是,提交的內容在URL中,一開始就已經按照編碼分析提交內容,setCharacterEncoding()自然就無效。
get需在Tomcat的server.xml中的:
<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443"
URIEncoding="GBK" />
)加入URIEncoding="GBK",解決get請求亂碼問題response.setContentType("text/html;charset=gb2312"):是設置頁面中為中文編碼。即以哪種編碼返回給客戶端。
前者是設置動態文字(參數,數據庫),后者設置頁面靜態文字
response.setContentType指定 返回給客戶端的編碼,同時指定了瀏覽器顯示的編碼.
response.setCharacterEncoding設置HTTP 響應的編碼,如果之前使用response.setContentType設置了編碼格式,則使用response.setCharacterEncoding指定的編碼格式覆蓋之前的設置.與response.setContentType相同的是,調用此方法,必須在getWriter執行之前或者response被提交之前.
JSP和Servlet的六種中文亂碼處理方法
一、表單提交時出現亂碼:
在進行表單提交的時候,經常提交一些中文,自然就避免不了出現中文亂碼的情況,對於表單來說有兩種提交方式:get和post提交方式。所以請求的時候便有get請求和post請求。每種方式都有着不同的解決方法,之所以出現亂碼,原因就在於get請求時,其傳遞給服務器的數據是附加在URL地址之后的;而post的請求時,其傳遞給服務器的數據是作為請求體的一部分傳遞給服務器。這也就導致了對它們所產生的亂碼的處理方式是不同的。
1、客戶端的get請求
get提交時, 容器以容器的編碼 來編碼 如果用的tomcat 默認的編碼是iso-8859-1 在server.xml里面設置編碼 或者
代碼如下
String name = request.getPara...("name"); String strName = new String(name.getByte("iso-8859-1"),"GBK");
對於不同的請求方式,解決亂碼的問題也是不一樣的,對於客戶端的get請求來說,服務器端處理要想不出現亂碼,解決這個問題稍微復雜一些,需要用到String類型的構造函數,其中的一個構造函數就是用指定的編碼方式去解碼,一般都用“UTF-8”的方式。只要在服務器端將請求得到的參數重新構造成一個字符串就行了。
經過構造之后,客戶端輸入中文,且表單時get請求的情況下,str就變成了中文了。
2、客戶端的post請求
對於客戶端的post請求來說,處理亂碼的問題就比較簡單了,因為請求的數據時作為請求體的一部分傳遞給服務器的,所以只要修改請求內的編碼就行了。只要在服務器端的最開始處將請求的數據設置為“UTF-8”就行了,輸入如下語句:request. setCharacterEncoding(“UTF-8”);這樣用戶在服務器端獲取到的中文數據就不再是亂碼了。
二、超鏈接時出現亂碼(低版本瀏覽器不行IE6)
在Web開發中,挺多的時候都是通過超鏈接去傳遞中文參數的,這也會導致在顯示的時候也會出現亂碼,對於超鏈接來說,它實際上是向服務器端發送了一個請求,而它發出的請求是屬於get請求,所以對於超鏈接的亂碼來說,它處理亂碼的方式和表單的get請求出現亂碼的方式是一樣的。
三、重定向時出現亂碼(低版本瀏覽器不行IE6)
有時寫上response的sendRedirect方法進行重定向時也會出現亂碼,重定向時實際上也是向服務器發送了一個請求,所以解決亂碼的方法和和上面是一樣的。
四、瀏覽器版本低導致的亂碼
上網的時候,有時提交的一些信息在地址欄顯示的是“%2C%C6%CC%C6”的字樣,其實這都是防止出現亂碼進行的解決方案,如果你的瀏覽器是IE6或以下版本,則我們的第二種情況和第三種情況會出現亂碼(尤其是當中文是奇數的時候),這就不好使了所以我們必須采用另一種比較實際的作法:
在java.net包中提供了URLEncoder類和URLDcoder類,這兩個類又分別提供了encode和decode兩個靜態方法,分別用於進行編碼和解碼。我們將要傳遞的中文參數進行編碼之后,在傳遞給服務器,服務器解碼之后,就可以顯示中文了。
進行編碼:URLEncoder.encode(stuname,”UTF-8”)
傳遞給服務器:<a href=”/1.jsp?stuname<%=stuname%>”>傳遞</a>
進行解碼:URLDecoder.decode(stuname,”UTF-8”)
五、返回瀏覽器顯示的亂碼
在Servlet編程中,經常需要通過response對象將一些信息返回給瀏覽器,給我們的客戶端,而我們在服務器端顯示的中文,但是響應給客戶端瀏覽器卻是亂碼,這主要是由於response對象的getWriter()方法返回的PrintWriter對象默認使用“ISO-8859-1”字符集編碼進行Unicode字符串到字節數組的轉換,由於ISO8859-1字符集中根本就沒有包含中文字符,所以Java在進行轉換的時候會將無效的字符編碼輸出給客戶端,於是便出現了亂碼,為此ServletResponse接口中便定義了setCharacterEncoding、setContentType等方法來指定getWriter方法返回的PrintWriter對象所使用的字符集編碼,所以我們在寫Servlet程序中,在調用getWriter方法之前設置這些方法的值。
只要編寫Servlet文件中含有響應給客戶端的信息,那么就要寫上這兩句話。最好寫上第二句話,因為它的優先級高,它的設置結果將覆蓋setContentType等方法設置的字符編碼集。
六、修改Tomcat的編碼
在get請求所導致亂碼問題中,還有一種解決的方案,我們常用Tomcat作為運行Servlet和JSP的容器,而Tomcat內部默認的編碼是ISO-8859-1,所以對於get請求方式,其傳遞的數據(URI)會附加在訪問的資源后面,其編碼是Tomcat默認的,如果修改該URI的編碼,那么對於所有的get請求方式便不會出現亂碼了包括上邊說的重定向和超鏈接,在Tomcat的配置文件server.xml中找到修改Tomcat的端口的地方,在其內部加入URIEncoding屬性,設置為和你的項目中所設的編碼一樣的值,這里全部都是UTF-8。
在編寫Servlet和JSP的時候,為了避免出現亂碼,最重要的就是:采用一致的編碼,如果編碼都一致了,肯定不會出現亂碼。
以上這篇解決中文亂碼的幾種解決方法(推薦)就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。