JAVASCRIPT中URL 傳遞參數(特殊字符)解決方法及轉碼解碼的介紹
有些符號在URL中是不能直接傳遞的,如果要在URL中傳遞這些特殊符號,那么就要使用他們的編碼了。下表中列出了一些URL特殊符號及編碼
十六進制值
1. + URL 中+號表示空格 %2B
2. 空格 URL中的空格可以用+號或者編碼 %20
3. / 分隔目錄和子目錄 %2F
4. ? 分隔實際的 URL 和參數 %3F
5. % 指定特殊字符 %25
6. # 表示書簽 %23
7. & URL 中指定的參數間的分隔符 %26
8. = URL 中指定參數的值 %3D
解決的方法:
replace() 方法如果直接用str.replace("-","!") 只會替換第一個匹配的字符.
而str.replace(/\-/g,"!")則可以替換掉全部匹配的字符(g為全局標志)。
replace()
js中替換字符變量如下:
data2=data2.replace(/\%/g,"%25");
data2=data2.replace(/\#/g,"%23");
data2=data2.replace(/\&/g,"%26");
在使用url進行參數傳遞時,經常會傳遞一些 中文名(或含有特殊字符)的參數或URL地址,在后台處理時會發生轉換錯誤。在有些傳遞頁面使用GB2312,而在接收頁面使用UTF8,這樣接收到的參 數就可能會與原來發生不一致。使用服務器端的urlEncode函數編碼的URL,與使用客戶端java的encodeURI函數編碼的URL,結果就不 一樣。
java對文字進行編碼涉及3個函數:escape,encodeURI,encodeURIComponent,相應3個解碼函數:unescape,decodeURI,decodeURIComponent
java中的編碼方法:
escape() 方法:采用ISO Latin字符集對指定的字符串進行編碼。所有的空格符、標點符號、特殊字符以及其他非ASCII字符都將被轉化成%xx格式的字符編碼(xx等於該字符 在字符集表里面的編碼的16進制數字)。比如,空格符對應的編碼是%20。unescape方法與此相反。不會被此方法編碼的字符: @ * / +
encodeURI()方法:把URI字符串采用UTF-8編碼格式轉化成escape格式的字符串。不會被此方法編碼的字符:! @ # $& * ( ) = : / ; ? + '
encodeURIComponent ()方法:把URI字符串采用UTF-8編碼格式轉化成escape格式的字符串。與encodeURI()相比,這個方法將對更多的字符進行編碼,比如 / 等字符。所以如果字符串里面包含了URI的幾個部分的話,不能用這個方法來進行編碼,否則 / 字符被編碼之后URL將顯示錯誤。不會被此方法編碼的字符:! * ( )
因 此,對於中文字符串來說,如果不希望把字符串編碼格式轉化成UTF-8格式的(比如原頁面和目標頁面的charset是一致的時候),只需要使用 escape。如果你的頁面是GB2312或者其他的編碼,而接受參數的頁面是UTF-8編碼的,就要采用encodeURI或者 encodeURIComponent。
另外,encodeURI/encodeURIComponent是在java1.5之后引進的,escape則在java1.0版本就有。
1、 傳遞參數時需要使用encodeURIComponent,這樣組合的url才不會被#等特殊字符截斷。
例如:
Html代碼
- < languagelanguage="java">write('<a href="http://passport.baidu.com/?logout&aid=7&u='+encodeURIComponent("http://cang.baidu.com/bruce42")+'">退出</a>');</>
2、 進行url跳轉時可以整體使用encodeURI
例如:
Java代碼
- Location.href=encodeURI("http://cang.baidu.com/do/s?word=百度&ct=21");
3、 js使用數據時可以使用escape
例如:搜藏中history紀錄。
4、 escape對0-255以外的unicode值進行編碼時輸出%u****格式,其它情況下escape,encodeURI,encodeURIComponent編碼結果相同。
最多使用的應為encodeURIComponent,它是將中文、韓文等特殊字符轉換成utf-8格式的url編碼,所以如果給后台傳遞參數需要使用encodeURIComponent時需要后台解碼對utf-8支持(form中的編碼方式和當前頁面編碼方式相同)
escape不編碼字符有69個:*,+,-,.,/,@,_,0-9,a-z,A-Z
encodeURI不編碼字符有82個:!,#,$,&,',(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,A-Z
encodeURIComponent不編碼字符有71個:!, ',(,),*,-,.,_,~,0-9,a-z,A-Z
以下是url中可能用到的特殊字符及在url中的經過編碼后的值:
字符
特殊字符的含義
URL編碼
符號 | 解釋 | 轉義 |
# | 用來標志特定的文檔位置 | %23 |
% | 對特殊字符進行編碼 | %25 |
& | 分隔不同的變量值對 | %26 |
+ | 在變量值中表示空格 | %2B |
/ | 表示目錄路徑 | %2F |
\ | 表示目錄路徑 | %5C |
= | 用來連接鍵和值 | %3D |
? | 表示查詢字符串的開始 | %3F |
空格 | 空格 | %20 |
. | 句號 | %2E |
: | 冒號 | %3A |
項目中發現,直接對url中的參數部分做encodeURI()編碼轉換,后台servlet通過getParamater()獲取時,不需要轉換可以直接獲取到正確的值。
附錄:
javascript中可用的編碼解碼函數,有如下的組合:
- escape(string);
unescape(string); - encodeURI(string);
decodeURI(string); - encodeURIComponent(string);
decodeURIComponent(string);
他們之間的區別為:
escape/unescape:
以16進制編碼字符串,對空格、符號等字符用%xx編碼表示,對中文等字符用%uxxxx編碼表示。自javascript1.5之后,此方法已經不被推薦使用。
encodeURI/decodeURI:
以UTF-8編碼編碼字符串,對這些字符:“ ; , / ? : @ & = + $ ”不做編碼。
encodeURIComponent/decodeURIComponent:
以UTF-8編碼編碼所有字符串。
因為escape/unescape已經deprecated。就不說它了,encodeURI和encodeURIComponent之前的區別用實例說明:
比如說要使用get方式將一個參數u,傳遞給服務器:
var u="index.php?blogId=1&op=Default";
var getURL="http://www.simplelife.cn/test.php?p="+encodeURI(u);
var getURL="http://www.simplelife.cn/test.php?p="+encodeURI(u);
這里,如果使用了encodeURI,那么最終的getURL的值為:
http://www.simplelife.cn/test.php?p=index.php?blogId=1&op=Default
這樣,對參數u中的字符"&op=Default",將不會作為字符串參數傳遞到服務器端,而是當作test.php的參數傳遞過去了,因為對"&op=Default"中的字符"&"沒有做編碼。
所以,在這種應用場景下,就需要使用encodeURIComponent,編碼后的getURL值為:
http://www.simplelife.cn/test.php?p=index.php%3FblogId%3D1%26op%3DDefault
這樣,參數就可以順利傳遞過去了。在服務器端得到的字符串將是正確的u。
反之,如果需要通過get方式訪問某一URL,但是URL中包含中文等字符,為了防止亂碼等編碼問題,需要將URL通過encodeURI進行編碼。