Java URL處理
URL(Uniform Resource Locator)中文名為統一資源定位符,有時也被俗稱為網頁地址。表示為互聯網上的資源,如網頁或者FTP地址。
本章節我們將介紹Java是如處理URL的。URL可以分為如下幾個部分。
protocol://host:port/path?query#ref
protocols(協議)可以是 HTTP, HTTPS, FTP, 和File。port 為端口號。path為文件路徑及文件名。
HTTP協議的URL實例如下:
http://www.cnblogs.com/toutou/
以上URL實例並未指定端口,因為HTTP協議默認的端口號為80。
URL 類方法
在java.net包中定義了URL類,該類用來處理有關URL的內容。對於URL類的創建和使用,下面分別進行介紹。
java.net.URL提供了豐富的URL構建方式,並可以通過java.net.URL來獲取資源。
序號 | 方法描述 |
---|---|
1 | public URL(String protocol, String host, int port, String file) throws MalformedURLException. 通過給定的參數(協議、主機名、端口號、文件名)創建URL。 |
2 | public URL(String protocol, String host, String file) throws MalformedURLException 使用指定的協議、主機名、文件名創建URL,端口使用協議的默認端口。 |
3 | public URL(String url) throws MalformedURLException 通過給定的URL字符串創建URL |
4 | public URL(URL context, String url) throws MalformedURLException 使用基地址和相對URL創建 |
URL類中包含了很多方法用於訪問URL的各個部分,具體方法及描述如下:
序號 | 方法描述 |
---|---|
1 | public String getPath() 返回URL路徑部分。 |
2 | public String getQuery() 返回URL查詢部分。 |
3 | public String getAuthority() 獲取此 URL 的授權部分。 |
4 | public int getPort() 返回URL端口部分 |
5 | public int getDefaultPort() 返回協議的默認端口號。 |
6 | public String getProtocol() 返回URL的協議 |
7 | public String getHost() 返回URL的主機 |
8 | public String getFile() 返回URL文件名部分 |
9 | public String getRef() 獲取此 URL 的錨點(也稱為"引用")。 |
10 | public URLConnection openConnection() throws IOException 打開一個URL連接,並運行客戶端訪問資源。 |
實例
以上實例演示了使用java.net的URL類獲取URL的各個部分參數:
// 文件名 : URLDemo.java import java.net.*; import java.io.*; public class URLDemo { public static void main(String [] args) { try { URL url = new URL("http://www.cnblogs.com/index.html?language=cn#j2se"); System.out.println("URL is " + url.toString()); System.out.println("protocol is " + url.getProtocol()); System.out.println("authority is " + url.getAuthority()); System.out.println("file name is " + url.getFile()); System.out.println("host is " + url.getHost()); System.out.println("path is " + url.getPath()); System.out.println("port is " + url.getPort()); System.out.println("default port is " + url.getDefaultPort()); System.out.println("query is " + url.getQuery()); System.out.println("ref is " + url.getRef()); }catch(IOException e) { e.printStackTrace(); } } }
以上實例編譯運行結果如下:
URL is http://www.cnblogs.com/index.html?language=cn#j2se protocol is http authority is www.cnblogs.com file name is /index.htm?language=cn host is www.amrood.com path is /index.html port is -1 default port is 80 query is language=cn ref is j2se
URLConnections 類方法
openConnection() 返回一個 java.net.URLConnection。
例如:
-
如果你連接HTTP協議的URL, openConnection() 方法返回 HttpURLConnection 對象。
-
如果你連接的URL為一個 JAR 文件, openConnection() 方法將返回 JarURLConnection 對象。
-
等等...
URLConnection 方法列表如下:
序號 | 方法描述 |
---|---|
1 | Object getContent() 檢索URL鏈接內容 |
2 | Object getContent(Class[] classes) 檢索URL鏈接內容 |
3 | String getContentEncoding() 返回頭部 content-encoding 字段值。 |
4 | int getContentLength() 返回頭部 content-length字段值 |
5 | String getContentType() 返回頭部 content-type 字段值 |
6 | int getLastModified() 返回頭部 last-modified 字段值。 |
7 | long getExpiration() 返回頭部 expires 字段值。 |
8 | long getIfModifiedSince() 返回對象的 ifModifiedSince 字段值。 |
9 | public void setDoInput(boolean input) URL 連接可用於輸入和/或輸出。如果打算使用 URL 連接進行輸入,則將 DoInput 標志設置為 true;如果不打算使用,則設置為 false。默認值為 true。 |
10 | public void setDoOutput(boolean output) URL 連接可用於輸入和/或輸出。如果打算使用 URL 連接進行輸出,則將 DoOutput 標志設置為 true;如果不打算使用,則設置為 false。默認值為 false。 |
11 | public InputStream getInputStream() throws IOException 返回URL的輸入流,用於讀取資源 |
12 | public OutputStream getOutputStream() throws IOException 返回URL的輸出流, 用於寫入資源。 |
13 | public URL getURL() 返回 URLConnection 對象連接的URL |
實例
以下實例中URL采用了HTTP 協議。 openConnection 返回HttpURLConnection對象。
// 文件名 : URLConnDemo.java import java.net.*; import java.io.*; public class URLConnDemo { public static void main(String [] args) { try { URL url = new URL("http://www.cnblogs.com"); URLConnection urlConnection = url.openConnection(); HttpURLConnection connection = null; if(urlConnection instanceof HttpURLConnection) { connection = (HttpURLConnection) urlConnection; } else { System.out.println("Please enter an HTTP URL."); return; } BufferedReader in = new BufferedReader( new InputStreamReader(connection.getInputStream())); String urlString = ""; String current; while((current = in.readLine()) != null) { urlString += current; } System.out.println(urlString); }catch(IOException e) { e.printStackTrace(); } } }
以上實例編譯運行結果如下:
$ java URLConnDemo .....a complete HTML content of home page of amrood.com.....