Java獲取URL鏈接的文件類型

本文轉載自查看原文 2012-05-21 10:12 12031 Java

在寫網絡爬蟲的時候，需要根據鏈接來獲取文件類型，將內容正確存儲。之前我都是根據鏈接的后綴來判斷的，比如：

http://img12.360buyimg.com/da/20120330/88_31_ZySDre.jpg

這個鏈接指向的文件就是個jpg文件。但是后來發現有諸如

http://jprice.360buyimg.com/getSkuPriceImgService.action?skuId=1850001109&origin=1&webSite=1&type=1的鏈接，這招就不靈了。后來谷歌百度了一下也沒發現解決辦法。后來機緣巧合在Java Network Programming上找到了一個辦法：

URLConnection class provides two static methods to help programs figure out the MIME type of some data; you can use these if the content type just isn't available or if you have reason to believe that the content type you're given isn't correct。

就是說URLConnection提供了兩種方法可以猜測（根據實測結果，這個猜測是相當的准）數據的MIME類型。

第一個是：

public static String guessContentTypeFromName(String name)

這個方法根據URL文件部分的后綴名來判斷類型，跟之前我的方法一樣。這個不能解決上面那個問題。
第二個是：

public static String guessContentTypeFromStream(InputStream in)
這個方法是根據流的前面幾個字節來判斷類型，這個就不需要文件后綴名了，完全可以解決上面那個問題。

測試代碼如下：

		BufferedInputStream bis = null;
		HttpURLConnection urlconnection = null;
		URL url = null;			
                url = new URL(strUrl);
	        urlconnection = (HttpURLConnection) url.openConnection();
	        urlconnection.connect();
		bis = new BufferedInputStream(urlconnection.getInputStream());
	        System.out.println("file type:"+HttpURLConnection.guessContentTypeFromStream(bis));

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Java獲取URL鏈接的文件類型 JAVA通過URL鏈接獲取視頻文件信息（無需下載文件） JAVA從URL參數鏈接中獲取指定參數的值 Java獲取項目當前請求的全部URL，Java獲取Referer，Java獲取完整鏈接地址URL 通過JS獲取URL鏈接帶的參數 Java依據文件頭獲取文件類型 java根據頭文件獲取文件類型 java url 獲取文件_[轉]從URL獲取文件保存到本地的JAVA代碼,url 請求設置http請求頭 java 讀取文件的幾種方式和通過url獲取文件 java 讀取文件的幾種方式和通過url獲取文件