基於token的身份驗證的原理

本文轉載自查看原文 2021-06-11 10:11 196 計算機網絡

本文轉載自：https://blog.csdn.net/wnvalentin/article/details/89854980

1 發展史

1、很久很久以前，Web 基本上就是文檔的瀏覽而已，既然是瀏覽，作為服務器，不需要記錄誰在某一段時間里都瀏覽了什么文檔，每次請求都是一個新的HTTP協議，就是請求加響應，尤其是我不用記住是誰剛剛發了HTTP請求，每個請求對我來說都是全新的。這段時間很嗨皮。

2、但是隨着交互式Web應用的興起，像在線購物網站，需要登錄的網站等等，馬上就面臨一個問題，那就是要管理會話，必須記住哪些人登錄系統，哪些人往自己的購物車中放商品，也就是說我必須把每個人區分開，這就是一個不小的挑戰，因為HTTP請求是無狀態的，所以想出的辦法就是給大家發一個會話標識(session id), 說白了就是一個隨機的字串，每個人收到的都不一樣，每次大家向我發起HTTP請求的時候，把這個字符串給一並捎過來，這樣我就能區分開誰是誰了。

3、這樣大家很嗨皮了，可是服務器就不嗨皮了，每個人只需要保存自己的session id，而服務器要保存所有人的session id ！如果訪問服務器多了，就得由成千上萬，甚至幾十萬個。這對服務器說是一個巨大的開銷，嚴重的限制了服務器擴展能力，比如說我用兩個機器組成了一個集群，小F通過機器A登錄了系統，那session id會保存在機器A上，假設小F的下一次請求被轉發到機器B怎么辦？機器B可沒有小F的 session id啊。

有時候會采用一點小伎倆： session sticky ，就是讓小F的請求一直粘連在機器A上，但是這也不管用，要是機器A掛掉了，還得轉到機器B去。

那只好做session 的復制了，把session id 在兩個機器之間搬來搬去，快累死了。

后來有個叫Memcached的支了招：把session id 集中存儲到一個地方，所有的機器都來訪問這個地方的數據，這樣一來，就不用復制了，但是增加了單點失敗的可能性，要是那個負責session 的機器掛了，所有人都得重新登錄一遍，估計得被人罵死。

也嘗試把這個單點的機器也搞出集群，增加可靠性，但不管如何，這小小的session 對我來說是一個沉重的負擔

4、於是有人就一直在思考，我為什么要保存這可惡的session呢，只讓每個客戶端去保存該多好？

可是如果不保存這些session id , 怎么驗證客戶端發給我的session id 的確是我生成的呢？如果不去驗證，我們都不知道他們是不是合法登錄的用戶，那些不懷好意的家伙們就可以偽造session id , 為所欲為了。

嗯，對了，關鍵點就是驗證！

比如說，小F已經登錄了系統，我給他發一個令牌(token)，里邊包含了小F的 user id，下一次小F 再次通過Http 請求訪問我的時候，把這個token 通過Http header 帶過來不就可以了。

不過這和session id沒有本質區別啊，任何人都可以可以偽造，所以我得想點兒辦法，讓別人偽造不了。

那就對數據做一個簽名吧，比如說我用HMAC-SHA256 算法，加上一個只有我才知道的密鑰，對數據做一個簽名，把這個簽名和數據一起作為token ，由於密鑰別人不知道，就無法偽造token了。

這個token 我不保存，當小F把這個token 給我發過來的時候，我再用同樣的HMAC-SHA256 算法和同樣的密鑰，對數據再計算一次簽名，和token 中的簽名做個比較，如果相同，我就知道小F已經登錄過了，並且可以直接取到小F的user id , 如果不相同，數據部分肯定被人篡改過，我就告訴發送者：對不起，沒有認證。

Token 中的數據是明文保存的（雖然我會用Base64做下編碼，但那不是加密），還是可以被別人看到的，所以我不能在其中保存像密碼這樣的敏感信息。

當然，如果一個人的token 被別人偷走了，那我也沒辦法，我也會認為小偷就是合法用戶，這其實和一個人的session id 被別人偷走是一樣的。

這樣一來，我就不保存session id 了，我只是生成token , 然后驗證token，我用我的CPU計算時間獲取了我的session 存儲空間！

解除了session id這個負擔，可以說是無事一身輕，我的機器集群現在可以輕松地做水平擴展，用戶訪問量增大，直接加機器就行。這種無狀態的感覺實在是太好了！

2 Cookie

cookie 是一個非常具體的東西，指的就是瀏覽器里面能永久存儲的一種數據，僅僅是瀏覽器實現的一種數據存儲功能。

cookie由服務器生成，發送給瀏覽器，瀏覽器把cookie以 K-V 形式保存到某個目錄下的文本文件內，下一次請求同一網站時會把該cookie發送給服務器。由於cookie是存在客戶端上的，所以瀏覽器加入了一些限制確保cookie不會被惡意使用，同時不會占據太多磁盤空間，所以每個域的cookie數量是有限的。

3 Session

session 從字面上講，就是會話。這個就類似於你和一個人交談，你怎么知道當前和你交談的是張三而不是李四呢？對方肯定有某種特征（長相等）表明他就是張三。

session 也是類似的道理，服務器要知道當前發請求給自己的是誰。為了做這種區分，服務器就要給每個客戶端分配不同的“身份標識”，然后客戶端每次向服務器發請求的時候，都帶上這個“身份標識”，服務器就知道這個請求來自於誰了。至於客戶端怎么保存這個“身份標識”，可以有很多種方式，對於瀏覽器客戶端，大家都默認采用 cookie 的方式。

服務器使用session把用戶的信息臨時保存在了服務器上，用戶離開網站后session會被銷毀。這種用戶信息存儲方式相對cookie來說更安全，可是session有一個缺陷：如果web服務器做了負載均衡，那么下一個操作請求到了另一台服務器的時候session會丟失。

3.1 cookie和session的區別

session是存儲服務器端，cookie是存儲在客戶端，所以session的安全性比cookie高。

獲取session里的信息是通過存放在會話cookie里的session id獲取的。而session是存放在服務器的內存中里，所以session里的數據不斷增加會造成服務器的負擔，所以會把很重要的信息存儲在session中，而把一些次要東西存儲在客戶端的cookie里。

cookie確切的說分為兩大類：會話cookie和持久化cookie。

會話cookie是存放在客戶端瀏覽器的內存中，他的生命周期和瀏覽器是一致的，當瀏覽器關閉會話cookie也就消失了

持久化cookie是存放在客戶端硬盤中，持久化cookie的生命周期是我們在設置cookie時候設置的那個保存時間。

session的信息是通過sessionid獲取的，而sessionid是存放在會話cookie當中的，當瀏覽器關閉的時候會話cookie消失，所以sessionid也就消失了，但是session的信息還存在服務器端，只是查不到所謂的session，但它並不是不存在。所以session在服務器關閉的時候，或者是session過期，又或者調用了invalidate()，再或者是session中的某一條數據消失調用session.removeAttribute()方法，session在通過調用session.getsession來創建的。

4 Token

在Web領域基於Token的身份驗證隨處可見。在大多數使用Web API的互聯網公司中，tokens 是多用戶下處理認證的最佳方式。

以下幾點特性會讓你在程序中使用基於Token的身份驗證

無狀態、可擴展
支持移動設備
跨程序調用
安全

那些使用基於Token的身份驗證的大佬們：大部分你見到過的API和Web應用都使用tokens。例如Facebook, Twitter, Google+, GitHub等。

在介紹基於Token的身份驗證的原理與優勢之前，不妨先看看之前的認證都是怎么做的。

4.1 傳統方式——基於服務器的驗證

由於 HTTP 協議是無狀態的，這種無狀態意味着程序需要驗證每一次請求，從而辨別客戶端的身份。在這之前，程序都是通過在服務端存儲登錄的用戶信息來辨別身份的。這種方式一般都是通過存儲 session 來完成，可放在內存或磁盤上。下圖說明了基於服務器驗證身份的過程：

隨着Web，應用程序，已經移動端的興起，這種驗證的方式逐漸暴露出了問題。尤其是在可擴展性方面。

4.2 基於服務器驗證方式暴露的一些問題

Seesions：每次認證用戶發起請求時，服務器需要去創建一個記錄來存儲信息。當越來越多的用戶發請求時，內存的開銷也會不斷增加。
可擴展性：由於sessions 存放在服務器內存中，伴隨而來的是可擴展性問題。當我們想要增加服務器來解決負載問題時，session 里的關鍵性信息會限制我們的擴展。
CORS (跨域資源共享)：當我們擴展應用程序，讓數據能夠從不同設備上訪問時，跨域資源的共享會是一個讓人頭疼的問題。在使用 Ajax 抓取另一個域的資源時（移動端訪問我們的 API 服務器），可能會出現禁止請求的情況。
CSRF (跨站請求偽造)：用戶在訪問銀行網站時，他們很容易受到跨站請求偽造的攻擊，並且能夠被利用其訪問其他的網站。

在這些問題中，可擴展性是最突出的。因此我們有必要去尋求一種更有行之有效的方法。

4.3 基於Token的驗證原理

基於 Token 的身份驗證是無狀態的，我們不用將用戶信息存在服務器或 Session 中。這種概念解決了在服務端存儲信息時的許多問題。沒有 session 信息意味着你的程序可以根據需要去增減機器，而不用去擔心用戶是否登錄和已經登錄到了哪里。

雖然基於Token的身份驗證實現的方式很多，但大致過程如下:

用戶通過用戶名和密碼發送請求。
程序驗證。
程序返回一個簽名的 token 給客戶端。
客戶端儲存 token, 並且每次請求都會附帶它。
服務端驗證 token 並返回數據。

每一次請求都需要Token。Token 應該在 HTTP的頭部發送從而保證了 Http 請求無狀態。我們也需要設置服務器屬性

Access-Control-Allow-Origin: *

來讓服務器能接受到來自所有域的請求。需要注意的是，在ACAO頭部指定 * 時，不得帶有像HTTP認證，客戶端SSL證書和cookies的證書。

實現思路：

1.用戶登錄校驗，校驗成功后就返回Token給客戶端。

2.客戶端收到數據后保存在客戶端

3.客戶端每次訪問API是攜帶Token到服務器端。

4.服務器端采用filter過濾器校驗。校驗成功則返回請求數據，校驗失敗則返回錯誤碼

當我們在程序中認證了信息並取得 token 之后，我們便能通過這個 token 做許多的事情。我們甚至能基於創建一個基於權限的token傳給第三方應用程序，這些第三方程序能夠獲取到我們的數據（當然只限於該 token 被允許訪問的數據）。

4.5 Tokens的優勢

（1）無狀態、可擴展

在客戶端存儲的 token 是無狀態的，並且能夠被擴展。基於這種無狀態和不存儲Session信息，負載均衡服務器能夠將用戶的請求傳遞到任何一台服務器上，因為服務器與用戶信息沒有關聯。相反在傳統方式中，我們必須將請求發送到一台存儲了該用戶 session 的服務器上（稱為Session親和性），因此當用戶量大時，可能會造成一些擁堵。使用 token 完美解決了此問題。

（2）安全性

請求中發送 token 而不是 cookie，這能夠防止 CSRF(跨站請求偽造) 攻擊。即使在客戶端使用 cookie 存儲 token，cookie 也僅僅是一個存儲機制而不是用於認證。另外，由於沒有 session，讓我們少我們不必再進行基於 session 的操作。

Token 是有時效的，一段時間之后用戶需要重新驗證。我們也不一定需要等到token自動失效，token有撤回的操作，通過 token revocataion可以使一個特定的 token 或是一組有相同認證的 token 無效。

（3）可擴展性

使用 Tokens 能夠與其它應用共享權限。例如，能將一個博客帳號和自己的QQ號關聯起來。當通過一個第三方平台登錄QQ時，我們可以將一個博客發到QQ平台中。

使用 token，可以給第三方應用程序提供自定義的權限限制。當用戶想讓一個第三方應用程序訪問它們的數據時，我們可以通過建立自己的API，給出具有特殊權限的tokens。

（4）多平台與跨域

我們已經討論了CORS (跨域資源共享)。當我們的應用和服務不斷擴大的時候，我們可能需要通過多種不同平台或其他應用來接入我們的服務。

可以讓我們的API只提供數據，我們也可以從CDN提供服務（Having our API just serve data, we can also make the design choice to serve assets from a CDN.）。在為我們的應用程序做了如下簡單的配置之后，就可以消除 CORS 帶來的問題。只要用戶有一個通過了驗證的token，數據和資源就能夠在任何域上被請求到。

Access-Control-Allow-Origin: *

（5）基於標准

有幾種不同方式來創建 token。最常用的標准就是 JSON Web Tokens。很多語言都支持它。

參考文獻

[1] The ins and outs of Token-based Authentication.

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 基於Token的身份驗證的原理基於Token的身份驗證的原理基於 Token 的身份驗證身份驗證cookies和Token 基於token的身份驗證方法 Django基於Token的身份驗證 JavaWeb—基於Token的身份驗證基於token的身份驗證JWT 基於Token的身份驗證——JWT JAVA中的Token 基於Token的身份驗證