http的重定向我們經常是張口就來,整個流程也非常簡單,服務端HTTP返回碼是30x,頭里面的Location字段代表新的URL。如下圖所示:
但重定向也還是有需要深入探討地方,返回碼不僅有我們經常使用301和303還有302 307 308 它們有啥區別呢。可以按照是否緩存和重定向方法,兩個維度去拆分。
緩存(永久重定向) | 不緩存(臨時重定向) | |
---|---|---|
轉GET | 301 | 302、303 |
方法保持 | 308 | 307 |
如果是永久重定向那么瀏覽器客戶端就會緩存此次重定向結果,下次如果有請求則直接從緩存讀取,譬如我們切換域名,將所有老域名的流量轉入新域名,可以使用永久重定向。
如果只是臨時重定向那么瀏覽器則不會緩存,譬如我們的服務臨時升級,會使用臨時重定向。
方法保持的意思是原請求和重定向的請求是否使用相同的方法,譬如原請求是POST提交一個表單,如果是301重定向的話,重定向的請求會轉為GET重新提交,如果是308則會保持原來POST請求不變。
一、狀態碼的解釋
1、301 Moved Permanently(永久移動)
被請求的資源已永久移動到新位置,並且將來任何對此資源的引用都應該使用本響應返回的URI之一。如果可能,擁有鏈接編輯功能的客戶端應當自動把請求的地址修改為從服務器反饋回來的地址。除非額外指定,否則這個響應也是可緩存的。新的永久性的URI應當在響應的Location域中返回。除非這是一個HEAD請求,否則響應的實體中應當包含指向新的URI的超鏈接及簡短說明。如果這不是一個GET或者HEAD請求,因此瀏覽器禁止自動進行重定向,除非得到用戶的確認,因為請求的條件可能因此發生變化。
注意:對於某些使用HTTP/1.0協議的瀏覽器,當它們發送的POST請求得到了一個301響應的話,接下來的重定向請求將會變成GET方式。
// 客戶端發出請求
GET /blog HTTP/1.1 Host:www.example.com // 服務端響應,不帶Cache-Control頭部
HTTP/1.1 302 Moved Permanently Location:http://www.example.org/index.asp // 服務端響應,帶Cache-Control頭部
HTTP/1.1 302 Moved Permanently Location:http://www.example.org/index.asp
Cache-Control:private;max-age=600;
2、302 Found(發現)
要求客戶端執行臨時重定向(原始描述短語為“Moved Temporarily”)。由於這樣的重定向是臨時的,客戶端應當繼續向原有地址發送以后的請求。只有在Cache-Control或Expires中進行了指定的情況下,這個響應才是可緩存的。新的臨時性的URI應當在響應的Location域中返回。除非這是一個HEAD請求,否則響應的實體中應當包含指向新的URI的超鏈接及簡短說明。如果這不是一個GET或者HEAD請求,那么瀏覽器禁止自動進行重定向,除非得到用戶的確認,因為請求的條件可能因此發生變化。
注意:雖然RFC 1945和RFC 2068規范不允許客戶端在重定向時改變請求的方法,但是很多現存的瀏覽器將302響應視作為303響應,並且使用GET方式訪問在Location中規定的URI,而無視原先請求的方法。因此狀態碼303和307被添加了進來,用以明確服務器期待客戶端進行何種反應。
3、307 Temporary Redirect(臨時重定向)
在這種情況下,請求應該與另一個URI重復,但后續的請求應仍使用原始的URI。 與302相反,當重新發出原始請求時,不允許更改請求方法。 例如,應該使用另一個POST請求來重復POST請求
4、308 Permanent Redirect (永久重定向)
請求和所有將來的請求應該使用另一個URI重復。
307和308分別重復302和301的行為,但不允許HTTP方法更改。 例如,將表單提交給永久重定向的資源可能會順利進行。
5、301/302/303/307/308的區別
301,302是http1.0的內容,303、307、308是http1.1的內容。
301和302本來在規范中是不允許重定向時改變請求方法的(將POST改為GET),但是許多瀏覽器卻允許重定向時改變請求方法(這是一種不規范的實現)。
303的出現正是為了給上面的301,302這種行為作出個規范(將錯就錯吧),也就是允許重定向時改變請求方法。此外303響應禁止被緩存。
大多數的瀏覽器處理302響應時的方式恰恰就是上述規范要求客戶端處理303響應時應當做的,所以303基本用的很少,一般用302。
307和308的出現也是給上面的行為做個規范,不過是不允許重定向時改變請求方法。
總結一下就是:
(1)301、308是永久改變地址;302/303、307是臨時改變地址;
(2)301、302允許改變請求方法(post會改get);308、307不允許改變請求方法(post方法還是post方法)
注:永久(Permanent)和臨時(Temporary)的區別:永久是指原來訪問的資源已經永久刪除啦,客戶端應該根據新的URI訪問重定向。臨時是指訪問的資源可能暫時先用location的URI訪問,但舊資源還在的,下次你再來訪問的時候可能就不用重定向了。
(3)對SEO的友好性:(這里有些面試會問)
301與302的區別:301表示搜索引擎在抓取新內容的同時也將舊的網址交換為重定向之后的網址;302表示舊地址A的資源還在(仍然可以訪問),這個重定向只是臨時地從舊地址A跳轉到地址B,搜索引擎會抓取新的內容而保存舊的網址。
由此可知301對於SEO更友好,下面來詳細介紹。
二、301、302對SEO優化的影響及網址URL劫持
301和302跳轉,雖然最終看到的效果是一樣的,但對搜索引擎來講,301和302還是有區別的。301的含義是“永久重定向”,而302的含義是“臨時重定向”,那么,為什么不能用302呢?302 重定向和網址劫持(URL hijacking)有什么關系呢?這要從搜索引擎如何處理302轉向說起。
從定義來說,從網址A做一個302重定向到網址B時,主機服務器的隱含意思是 網址A隨時有可能改主意,重新顯示本身的內容或轉向其他的地方。大部分的搜索引擎在大部分情況下,當收到302重定向時,一般只要去抓取目標網址就可以 了,也就是說網址B。實際上如果搜索引擎在遇到302轉向時,百分之百的都抓取目標網址B的話,就不用擔心網址URL劫持了。
問 題就在於,有的時候搜索引擎,尤其是Google,並不能總是抓取目標網址。為什么呢?比如說,有的時候A網址很短,但是它做了一個302重定向到B網 址,而B網址是一個很長的亂七八糟的URL網址,甚至還有可能包含一些問號之類的參數。很自然的,A網址更加用戶友好,而B網址既難看,又不用戶友好。這 時Google很有可能會仍然顯示網址A。
由於搜索引擎排名算法只是程序而不是人,在遇到302重定向的時候,並不能像人一樣的去准確判定哪一個網址更適當,這就造成了網址URL劫持的可能性。也就是說,一個不道德的人在他自己的網址A做一個302重定向到你的網址B,出於某種原因, Google搜索結果所顯示的仍然是網址A,但是所用的網頁內容卻是你的網址B上的內容,這種情況就叫做網址URL劫持。你辛辛苦苦所寫的內容就這樣被別 人偷走了。
其實302的跳轉本身是沒有錯的,但因為被一些作弊者用多了,Google當然對這個就比較敏感了,畢竟Google面對的是如此海量的數據,你難道不怕被誤殺嗎?Google的官方內容一再強調用301來轉移內容,況且,301和302在程序上的設置相差很小,既然如此,何必要冒險用302呢?如果你對上面還是沒有看懂看看下面的的內容就知道了。
PR劫持的SEO作弊方法:
1、利用301和302跳轉
一般搜索引擎在處理301和302轉向的時候,都是把目標URL當作實際應該收錄的URL。如果你從域名A做301或者是302跳轉到域名B,而域名B的 PR 值比較高,域名A在PR更新后,也會顯示域名B的PR值。PR挾持最簡單的就是先做301或302跳轉到高PR的域名B,等PR更新過后,立刻取消轉向, 同時也獲得了和B站相同的PR值。這個做假的PR顯示值至少維持到下一次PR更新。
我的理解是,從網站A(網站比較爛)上做了一個302跳轉到網站B(搜索排名很靠前),這時候有時搜索引擎會使用網站B的內容,但卻收錄了網站A的地址,這樣在不知不覺間,網站B在為網站A作貢獻,網站A的排名就靠前了。
302 重定向所造成的網址URL劫持現象,已經存在一段時間了。不過到目前為止,似乎也沒有什么更好的解決方法。在正在進行的谷歌數據中心轉換中,302 重定向問題也是要被解決的目標之一。從一些搜索結果來看,網址劫持現象有所改善,但是並沒有完全解決。
301跳轉對查找引擎是一種對照馴良的跳轉編制,也是查找引擎能夠遭遇的跳轉編制,它告訴查找引擎,這個地址棄用了,永遠轉向一個新地址,可以轉移新域名的權重。而302重定向很容易被搜索引擎誤認為是利用多個域名指向同一網站,那么你的網站就會被封掉,罪名是“利用重復的內容來干擾Google搜索結果的網站排名”。
2、欺騙Google蜘蛛
通過程序檢測到Google蜘蛛,返回301或302轉向,對普通訪問者和其他蜘蛛都返回正常內容。這樣我們看到的是普通網站,只有Google會看到轉向,但是這種網站上的鏈接對PR值沒有任何貢獻。
三、使用場景
因為301與302的區別,所以導致產生302網址劫持,故不建議使用302重定向(然而瀏覽器默認是使用302重定向)
1、使用301的場景:(一般是資源位置永久更改)
(1)域名到期不想續費(或者發現了更適合網站的域名),想換個域名。
(2)在搜索引擎的搜索結果中出現了不帶www的域名,而帶www的域名卻沒有收錄,這個時候可以用301重定向來告訴搜索引擎我們目標的域名是哪一個。
(3)空間服務器不穩定,換空間的時候。
注:另外,返回301請求碼進行跳轉被谷歌認為是將網站地址由 HTTP 遷移到 HTTPS的最佳方法(然而大家都用302。。。。)
2、使用302的場景:(一般是普通的重定向需求:臨時跳轉)
(1)未登錄前先使用302重定向到登錄頁面,登錄成功后再跳回到原來請求的頁面
舉個例子,比如我未登錄京東前我就訪問京東的個人界面https://home.jd.com/,然后就會重定向到登錄界面,我們可以通過瀏覽器的dev-tool查看狀態碼,有
我們可以發現響應的狀態碼為302,並且返回了location為登錄界面的url,並且附帶了ReturnUrl方便我們登錄后跳回到https://home.jd.com/
(2)像微博之類的使用短域名,用戶瀏覽后需要重定向到真實的地址之類。
例如我訪問一個微博的秒拍視頻鏈接:http://t.cn/RuUMBnI,然后重定向到了實際的視頻地址miaopai.com,狀態碼為302。
3、使用307或308的場景
307很少用,與302類似,只不過是針對POST方法的請求不允許更改方法,不過我在訪問百度時,發現用了307狀態碼
308也很少用,與301類似,只不過是針對POST方法的請求不允許更改方法。