什么叫短鏈或短址?
就是把長的 URL 轉成短的 URL, 現在提供這種服務的有很多公司,我們以google家的 URL shortener 服務: http://goo.gl/ 為例。 任何長網址都會轉換成6位由大小寫字母和數字組合而成的短址,例如:http://goo.gl/QfuI3i 。長網址和短址都會存在google服務器,當我們請求http://goo.gl/QfuI3i這個短址,google服務器就會根據QfuI3i這個參數找到並跳轉到對應長網址。
新浪微博為什么使用短鏈?
- 無論多長的微博,都能夠轉成固定長短的短鏈,防止某些連接太長影響用戶輸入其他內容;
- 所有短鏈在算法上無法直接解鏈,必須經過新浪的服務器,把鏈接系統控制到自己的手上。這對網絡內容審察來說作用極其大,如果有人發的微博包含敏感內容,新浪就不予中轉;
- 重新組織鏈接網頁的內容,方便用戶在手機端查看;
- 由於長鏈中可能會包含#或者@這些特殊字符,給客戶端的字符串處理帶來壓力,編碼可以消除這些特殊符號;
- 由於所有鏈接都要經新浪的服務器,因此服務器保存有所有的鏈接,方便進行數據挖掘和統計分析。
Java實現
1 package com.wanda.restful.framework.test.shorturl; 2 3 import java.security.MessageDigest; 4 5 /** 6 * @version v1.0.0 7 * @author: wangyang 8 * Date: 2016-9-8 Time: 15:32 9 */ 10 public class Encript { 11 //十六進制下數字到字符的映射數組 12 private final static String[] hexDigits = {"0","1","2","3","4","5","6","7","8","9","A","B","C","D","E","F"}; 13 14 /**把inputString加密*/ 15 public static String md5(String inputStr){ 16 return encodeByMD5(inputStr); 17 } 18 19 /** 20 * 驗證輸入的密碼是否正確 21 * @param password 真正的密碼(加密后的真密碼) 22 * @param inputString 輸入的字符串 23 * @return 驗證結果,boolean類型 24 */ 25 public static boolean authenticatePassword(String password,String inputString){ 26 if(password.equals(encodeByMD5(inputString))){ 27 return true; 28 }else{ 29 return false; 30 } 31 } 32 33 /**對字符串進行MD5編碼*/ 34 private static String encodeByMD5(String originString){ 35 if (originString!=null) { 36 try { 37 //創建具有指定算法名稱的信息摘要 38 MessageDigest md5 = MessageDigest.getInstance("MD5"); 39 //使用指定的字節數組對摘要進行最后更新,然后完成摘要計算 40 byte[] results = md5.digest(originString.getBytes()); 41 //將得到的字節數組變成字符串返回 42 String result = byteArrayToHexString(results); 43 return result; 44 } catch (Exception e) { 45 e.printStackTrace(); 46 } 47 } 48 return null; 49 } 50 51 /** 52 * 輪換字節數組為十六進制字符串 53 * @param b 字節數組 54 * @return 十六進制字符串 55 * 56 */ 57 private static String byteArrayToHexString(byte[] b){ 58 StringBuffer resultSb = new StringBuffer(); 59 for(int i=0;i<b.length;i++){ 60 resultSb.append(byteToHexString(b[i])); 61 } 62 return resultSb.toString(); 63 } 64 65 //將一個字節轉化成十六進制形式的字符串 66 private static String byteToHexString(byte b){ 67 int n = b; 68 if(n<0) 69 n=256+n; 70 int d1 = n/16; 71 int d2 = n%16; 72 return hexDigits[d1] + hexDigits[d2]; 73 } 74 }
1 package com.wanda.restful.framework.test.shorturl; 2 3 /** 4 * Generator ShortUrl 5 * 數據庫中需要保存長鏈與短鏈之間的關系,通過訪問短鏈跳轉到長鏈接 6 * 7 * @version v1.0.0 8 * @author: wangyang 9 * Date: 2016-9-8 Time: 15:42 10 */ 11 public class ShortUrlGenerator { 12 public static void main(String[] args) { 13 String sLongUrl = "http://www.baidu.com"; 14 for (String shortUrl : shortUrl(sLongUrl)) { 15 System.out.println(shortUrl); 16 } 17 } 18 19 public static String[] shortUrl(String url) { 20 // 可以自定義生成 MD5 加密字符傳前的混合 KEY 21 String key = "wangyang"; 22 // 要使用生成 URL 的字符 23 String[] chars = new String[]{"a", "b", "c", "d", "e", "f", "g", "h", 24 "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t", 25 "u", "v", "w", "x", "y", "z", "0", "1", "2", "3", "4", "5", 26 "6", "7", "8", "9", "A", "B", "C", "D", "E", "F", "G", "H", 27 "I", "J", "K", "L", "M", "N", "O", "P", "Q", "R", "S", "T", 28 "U", "V", "W", "X", "Y", "Z" 29 }; 30 // 對傳入網址進行 MD5 加密 31 String sMD5EncryptResult = (Encript.md5(key + url)); 32 String hex = sMD5EncryptResult; 33 String[] resUrl = new String[4]; 34 //得到 4組短鏈接字符串 35 for (int i = 0; i < 4; i++) { 36 // 把加密字符按照 8 位一組 16 進制與 0x3FFFFFFF 進行位與運算 37 String sTempSubString = hex.substring(i * 8, i * 8 + 8); 38 // 這里需要使用 long 型來轉換,因為 Inteper .parseInt() 只能處理 31 位 , 首位為符號位 , 如果不用 long ,則會越界 39 long lHexLong = 0x3FFFFFFF & Long.parseLong(sTempSubString, 16); 40 String outChars = ""; 41 //循環獲得每組6位的字符串 42 for (int j = 0; j < 6; j++) { 43 // 把得到的值與 0x0000003D 進行位與運算,取得字符數組 chars 索引(具體需要看chars數組的長度 以防下標溢出,注意起點為0) 44 long index = 0x0000003D & lHexLong; 45 // 把取得的字符相加 46 outChars += chars[(int) index]; 47 // 每次循環按位右移 5 位 48 lHexLong = lHexLong >> 5; 49 } 50 // 把字符串存入對應索引的輸出數組 51 resUrl[i] = outChars; 52 } 53 return resUrl; 54 } 55 }