URL 與 URI
很多人會混淆這兩個名詞。
URL:(Uniform/Universal Resource Locator 的縮寫,統一資源定位符)。
URI:(Uniform Resource Identifier 的縮寫,統一資源標識符)(代表一種標准)。
關系:
URI 屬於 URL 更高層次的抽象,一種字符串文本標准。
就是說,URI 屬於父類,而 URL 屬於 URI 的子類。URL 是 URI 的一個子集。
二者的區別在於,URI 表示請求服務器的路徑,定義這么一個資源。而 URL 同時說明要如何訪問這個資源(http://)。
URI 示例
大家把瀏覽器地址欄里訪問網站的地址認為是URL就好了,也就是以HTTP/HTTPS開頭的URI子集。
端口 與 URL標准格式
何為端口?端口(Port),相當於一種數據的傳輸通道。用於接受某些數據,然后傳輸給相應的服務,而電腦將這些數據處理后,再將相應的回復通過開啟的端口傳給對方。
端口的作用:因為 IP 地址與網絡服務的關系是一對多的關系。所以實際上因特網上是通過 IP 地址加上端口號來區分不同的服務的。
端口是通過端口號來標記的,端口號只有整數,范圍是從0 到65535。
URL 標准格式
通常而言,我們所熟悉的 URL 的常見定義格式為:
scheme://host[:port#]/path/.../[;url-params][?query-string][#anchor]
scheme //有我們很熟悉的http、https、ftp以及著名的ed2k,迅雷的thunder等。 host //HTTP服務器的IP地址或者域名 port# //HTTP服務器的默認端口是80,這種情況下端口號可以省略。如果使用了別的端口,必須指明,例如tomcat的默認端口是8080 http://localhost:8080/ path //訪問資源的路徑 url-params //所帶參數 query-string //發送給http服務器的數據 anchor //錨點定位
利用 a 標簽自動解析 url
開發當中一個很常見的場景是,需要從 URL 中提取一些需要的元素,譬如 host 、 請求參數等等。
通常的做法是寫正則去匹配相應的字段,但是這里參考James 的 blog,原理是動態創建一個 a 標簽,利用瀏覽器的一些原生方法及一些正則(為了健壯性正則還是要的),完美解析 URL ,獲取我們想要的任意一個部分。
代碼如下:
// This function creates a new anchor element and uses location // properties (inherent) to get the desired URL data. Some String // operations are used (to normalize results across browsers). function parseURL(url) { var a = document.createElement('a'); a.href = url; return { source: url, protocol: a.protocol.replace(':',''), host: a.hostname, port: a.port, query: a.search, params: (function(){ var ret = {}, seg = a.search.replace(/^\?/,'').split('&'), len = seg.length, i = 0, s; for (;i<len;i++) { if (!seg[i]) { continue; } s = seg[i].split('='); ret[s[0]] = s[1]; } return ret; })(), file: (a.pathname.match(/([^/?#]+)$/i) || [,''])[1], hash: a.hash.replace('#',''), path: a.pathname.replace(/^([^/])/,'/$1'), relative: (a.href.match(/tps?:\/[^/]+(.+)/) || [,''])[1], segments: a.pathname.replace(/^\//,'').split('/') }; }
Usage 使用方法:
var myURL = parseURL('http://abc.com:8080/dir/index.html?id=255&m=hello#top'); myURL.file; // = 'index.html' myURL.hash; // = 'top' myURL.host; // = 'abc.com' myURL.query; // = '?id=255&m=hello' myURL.params; // = Object = { id: 255, m: hello } myURL.path; // = '/dir/index.html' myURL.segments; // = Array = ['dir', 'index.html'] myURL.port; // = '8080' myURL.protocol; // = 'http' myURL.source; // = 'http://abc.com:8080/dir/index.html?id=255
利用上述方法,即可解析得到 URL 的任意部分。
參考:https://github.com/chokcoco/cnblogsArticle/issues/6