百度 谷歌 Twitter,這么多短鏈接服務(Short Url)究竟哪家強?


一、短鏈接是什么

短鏈接。通俗來說。就是將長的URL網址,通過程序計算等方式。轉換為簡短的網址字符串。
它的原理也很easy,就是採用 Domain Redirect(域名重定向) ,將一個域名自己主動跳轉到另一個域名。

依據wikipedia描寫敘述,短鏈接的方案最早在2000年誕生。

在2009年11月,著名短鏈接服務提供商Bitly的訪問量是21億。可見短鏈接的使用需求是很大的。
維基地址

這里寫圖片描寫敘述


而在國內,短鏈接的普及與微博息息相關。

最早是由新浪仿照Twitter的140短篇博文功能,上線了新浪微博,之后微博服務開始風靡全中國。一個有意思的小插曲是,據說新浪與騰訊爭奪weibo拼音域名,終於新浪獲得了weibo.com的使用權。

這里寫圖片描寫敘述

也是因為微博的風靡,產生了短鏈接的大量剛需,因為一篇微博僅僅能寫140字,假設發送一個超長鏈接很占用字符數量,而且有可能140字符都容納不下一條鏈接。

參照例如以下一條鏈接。數一下有多少字符:
http://baike.baidu.com/link?

url=ZbFVNe9FDaoht-ZHu9snNTFPk2QEEWEz8-oFSkd4Fdo0pzPDwolG1tubpZ-bglJEDnqf6O4hIJ5dEIAW3IAQke3cyF-H3YmZ0EX65Z2xdjw1suMk56IxG-uNzAq9lI57M636J7FgNB5So2_1OPTk7oVe_5E_NhkiWlTqMpPpmxZj7m07Mk4UcL4HboQSF6Or


短鏈接服務產生后,應用很廣泛。比如:

 - 一些網店、博客等,上傳圖片url時限制了字符數,使用短鏈接能夠縮短url,保持url完整性。
 - 網絡轉發url,越短的url越easy操作和傳播。
 - 為了區分用戶來源,能夠使用短鏈接做訪問跟蹤。
 - 使用短鏈接。還能夠隱藏原始url。

凡事皆有利弊,短鏈接除了產生諸多優點,也帶來了一些麻煩。比如在郵件中,使用短鏈接形式的廣告地址。能夠避過垃圾郵件過濾。甚至,短鏈接還會帶來安全隱患。

短鏈接的濫用,也促使一些服務商、個人,把短鏈接的域名增加了黑名單。

當然。本文不深入討論短鏈接的利弊。

接下來。我們八一八國內外常見的短鏈接。


二、短鏈接究竟哪家強?

假設你發過微博。你知道新浪家有短鏈接。假設你twi過tter,你知道Twitter家有短鏈接。BAT、Google、Twitter,這可都是大廠啊。

究竟他們的短鏈接是哪家強呢?


新浪微博

首先從大家熟悉的新浪微博說起吧。

新浪微博的短鏈接域名為t.cn

我們先看看。什么樣的url會被識別,並轉化為短鏈接呢?

先來一個最簡單的 http://www.baidu.com

這里寫圖片描寫敘述

微博發出來,例如以下圖。

這里默認隱藏了鏈接地址,僅僅顯示為網頁鏈接

這里寫圖片描寫敘述

我們右鍵拷貝出這個地址,域名顯示為t.cn,整個鏈接為 http://t.cn/h5mwx

這里寫圖片描寫敘述

訪問該鏈接。網頁即被重定向到baidu

這里寫圖片描寫敘述

Bingo! 這個url成功被識別,並自己主動轉化為了一條t.cn的短鏈接

我推測url的識別是通過協議頭。比如http:// https://來識別的。

好的,依據這個思路。我們再實驗一條。這一次去掉http://

這里寫圖片描寫敘述

微博發出來

這里寫圖片描寫敘述

果然,這條url並未被識別。因此依照普通字符的形式發了出來。

那么,其它的協議頭能否被識別呢?我們試一下https://

這里寫圖片描寫敘述

https被識別為鏈接

這里寫圖片描寫敘述

再試一下ftp://

這里寫圖片描寫敘述

我們注意到。ftp://ftp.baidu.com/zhidao是一個有效鏈接。但並未被識別。

這里寫圖片描寫敘述

總結一下微博的短鏈接:

1.微博的短鏈接域名是t.cn
2.微博的短鏈接,僅識別http://和https://開頭的url

另外,新浪已經開放了短鏈接的api。

網上比較好的一個新浪短鏈接工具是aTool在線
aTool在線里,包括了短鏈接生成和反查詢,以及訪問數統計

這里寫圖片描寫敘述

這里寫圖片描寫敘述


騰訊微博

說完新浪微博。不得不正確比一下騰訊微博。騰訊微博的短鏈接域名為url.cn。那么它與新浪有哪些異同呢?

首先仍然是最常見的鏈接。 http://www.hao123.com

這里寫圖片描寫敘述

url被成功轉換為短鏈接

這里寫圖片描寫敘述

再換一個ftp://ftp.baidu.com/zhidao

這里寫圖片描寫敘述

ftp://開頭的url識別成功。

騰訊的技術還是比較嚴謹的哈

這里寫圖片描寫敘述

同樣,我們把http://協議頭去掉

這里寫圖片描寫敘述

這個url未識別。看來普遍採用的方案。就是識別協議頭了

這里寫圖片描寫敘述

那么我們再實驗一種情況,假設url是眼下不存在的呢?

這里寫圖片描寫敘述

url被轉換為url.cn短鏈接。

可見,短鏈接方案通常不識別鏈接有效性。

這里寫圖片描寫敘述

興趣來了,咱們再實驗一種情況。假如兩個人分別分享同一條鏈接,轉換的url.cn是否同樣呢?

仍以hao123為例

這里寫圖片描寫敘述

兩個賬號同樣發送同樣url。轉換后的短鏈接同樣。可見,騰訊微博並未將短鏈接與賬號關聯,這也減少了技術方案的難度和資源消耗。

這里寫圖片描寫敘述
這里寫圖片描寫敘述

依舊總結一下:

1.騰訊微博的短鏈接域名為url.cn
2.騰訊微博的短鏈接,能夠識別常見的http、https、ftp等協議頭
3.騰訊微博的短鏈接與賬號無關
4.騰訊微博的短鏈接生成時。不檢查url有效性

Twitter

前面已經對照了新浪、騰訊兩大微博。因此不得不提到Twitter。Twitter的短鏈接域名為t.co
因為國內Twitter被牆,這里不再具體介紹它的短鏈接。僅說兩點有意思的地方

1.是Twitter能夠正常識別www.baidu.com形式的鏈接

這里寫圖片描寫敘述

推文中顯示出了正常鏈接。實際上它已經被轉換為短鏈接

這里寫圖片描寫敘述

右鍵將url拷貝出來。看看真相

這里寫圖片描寫敘述

2.更有意思的是,www.baidu.com與http://www.baidu.com被視為同樣內容,而且不同意反復發送

這里寫圖片描寫敘述

這里寫圖片描寫敘述

twitter能夠識別www.baidu.com形式的常見鏈接。這個令我比較佩服,很用心

google

吧啦吧啦說了一大堆,各位看官煩了沒?假設還有興趣,繼續看,google的短鏈接做到了那些事情。

google短鏈接的域名是goo.gl

注意。谷歌在國內的訪問並不穩定。

google短鏈接與微博等不同的一點是,它是一個的獨立工具。而不是依附於社交產品的附屬產物。
這一點很重要:微博等產品中的短鏈接,是基於傳播信息的須要。把url轉換縮短。僅此而已。

而google基於工具的思路。因此決定了它更優秀的一些特點

1.首先,google短鏈接有獨立的訪問頁面。獨立的域名。

google短鏈接入口

2.google短鏈接頁面干凈簡潔。並不摻雜社交、廣告等內容

這里寫圖片描寫敘述

3.未登錄google賬號,也能夠使用

4.登錄google賬號時,能夠保存生成短鏈接的歷史記錄,並進行訪問跟蹤

這里寫圖片描寫敘述

5.不同賬號之間,同一個url轉換生成的短鏈接不同,這樣能夠區分訪問跟蹤。

未登錄google時,更換瀏覽器,同一個url也會生成不同的短鏈接。推測是依據瀏覽器、電腦屬性等識別了唯一的游客身份。

這里寫圖片描寫敘述

這里寫圖片描寫敘述

介紹了goo.gl諸多特性后,我們依舊來做一點技術分析

a. goo.gl對url的形式保持開放態度,來者不拒。

a.b 以及 我能夠 這種字符串依舊能夠生成短鏈接。也就是說全然不正確url進行不論什么校驗和限制

這里寫圖片描寫敘述

這里寫圖片描寫敘述

b. 別忘了我們剛剛提到。不同賬號之間。甚至不同游客之間,同一個url會轉換成不同的短鏈接。

這對於數據處理來說是有一定挑戰的,當然我相信對於谷歌來說這真是缺乏挑戰

- 短鏈接的存儲。從簡單的 url-短鏈接 相應關系,變成了 賬號-url-短鏈接 相應關系
- 數據庫表怎樣設計。才干兼顧 存儲、查詢、賬戶信息合並、訪問統計
- 另外一個與短鏈接無關的,就是:在多種電腦、多種瀏覽器、甚至如今多種移動終端的形勢下,谷歌怎樣track游客用戶

總體來說,goo.gl還是做得很用心,僅僅是在國內的話須要慎用


百度

既然說到谷歌,就對照一下百度的短鏈接服務吧,地址 http://dwz.cn/

1.注意謹防偽冒,百度短鏈接頁面例如以下圖

這里寫圖片描寫敘述

而百度搜索推薦的竟然是一個冒牌的服務 http://baidu.nu/ 。。!


當然這個服務做得也還能夠。能夠自主選擇多種域名

這里寫圖片描寫敘述

這里寫圖片描寫敘述

2.百度短鏈接無賬號區分。一個短鏈接生成后即形成 url-短鏈接 相應關系

這里寫圖片描寫敘述

3.百度會驗證url有效性

這里寫圖片描寫敘述

4.百度短鏈接能夠自己定義后綴

這里寫圖片描寫敘述

這里寫圖片描寫敘述

5.已經存在的url,不能再自己定義后綴。可見百度 url-短鏈接 是一對一的存儲關系

這里寫圖片描寫敘述

總結一下百度短鏈接服務的特點

1.百度短鏈接的域名是dwz.cn
2.百度短鏈接會識別url有效性
3.百度短鏈接是 url-短鏈接 一對一的映射關系
4.百度短鏈接能夠自己定義后綴
5.百度短鏈接開放了api,能夠基於百度開發自己的短鏈接服務

總體來說,除了無法統計這一點略顯不足,總體質量與goo.gl也是不相伯仲的


其它

以上介紹了幾款短鏈接相關的產品。總體來說。百度、google的短鏈接服務還是比較值得信賴的

除了大廠的短鏈接服務外,另一些第三方的做得不錯。比如:

http://www.atool.org/shorturl.php aTool工具
http://baidu.nu/ 上面提到過的,百度冒牌服務
http://t.im/ t.im短網址
https://bitly.com/shorten/ 國外老品牌,bitly


短鏈接會被搜索引擎抓取嗎

另一個關於短鏈接有意思的話題是,短鏈接是否會被搜索引擎抓取呢?

答案是NO。至於搜索引擎怎樣做到識別並篩選短鏈接,有興趣的能夠查閱一下資料

這里有一篇網址在討論這個問題
http://www.quora.com/Does-Google-crawl-http-goo-gl-shortened-URLs


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM