輕型的接口訪問頻率限制服務模型的設計與實現【轉】


原文地址:http://www.iam3y.com/html/878.html

最近需要設計open api的接口頻次控制相關實現,便查閱相關文檔。

接口頻次控制主要包括兩方面:

(1)業務ID對某一個接口某時間間隔(如一分鍾)內訪問的次數 限制

(2)業務ID在某個時間周期(如一天)內訪問的次數 限制

 

對於存儲並進行頻次計數的服務來說,要具備以下的特點:

(1)自更新能力,在某個約定的時間點對所有的node(節點)進行自更新操作,也就是常說的出廠設置

(2)協議輕型能力,協議必須盡可能簡單,才能達到高效的目的

(3)增刪查改能力,允許業務調用方對某個節點的數據增刪查改

以上所提節點,如node,大體包含了如下分支

node.bizid,業務id,給某個客戶分配的業務id,是客戶在頻次計數系統里的唯一標識

node.m_count,某分鍾周期內訪問次數

node.count,某計數周期內訪問次數,如一天。

node.starttime,計數開始周期

node.endtime,計數結束周期,記錄客戶最后一次接口訪問的時間,也用於頻次計數系統的自更新

node.m_starttime,分鍾計數開始時間

node.m_endtime,分鍾計數結束時間,當(node.m_endtime-node.m_starttime)<60 && node.m_count>M_MAX_COUNT,接口訪問被拒絕,當(node.m_endtime- node.m_starttime)> 60,同時更新node.m_endtime,node.m_starttime為當前時間,重置node.m_count

 

同樣,天計數周期的原理也如此。

 

基於以上目標,我們看系統要怎么去實現,如下內容為轉載內容。

原文鏈接 輕型的訪問頻率限制服務模型的設計與實現

 

        為防止開放系統的公共接口被過度調用,本文提出一種面向系統內部的訪問頻率限制服務輕型模型,並給出泛型鍵值索引、頻率約束算法等關鍵技術實現。該服務模 型抽象了各種業務的訪問頻率限制邏輯,記錄各個鍵值對特定業務的訪問間隔和訪問時間,通過頻率約束算法,為系統公共接口提供訪問頻率約束依據,使得公共接 口可以對外界請求做出拒絕,消除了因接口過調用而帶來的系統安全隱患,提高了系統的服務質量以及接口調用的有效性。


關鍵字:訪問頻率限制; MMAP集群;泛型鍵值索引

1.引言
對於大型開放平台,其公開的服務接口會被外界頻繁調用,在不加任何訪問頻率的控制策略,這些接口甚至可能會被過度調用。給系統帶來額外的負擔。
過度調用,會導致兩方面的后果:接口調用者通過對服務接口的多次調用間接獲取系統安全信息,對系統造成隱患,常見的有:短時間內對登陸服務接口,通過枚舉 組合,破解用戶系統密碼。另一方面,因為用戶個體數量龐大,單個用戶對接口大量的調用,會影響其他用戶的服務質量,降低系統的有效負荷。

        用戶訪問數達到一定量級的系統平台均會遇到上述問題,並各自都有相應的解決方法。但現成的方法是,把訪問限制功能作為獨立的模塊,系統內部需要使用此功能 的業務,就把該模塊的拷貝納入作為業務的子模塊。這種系統組織方式既不利於維護,也不利於管理。而且訪問約束所適用的類型往往是固定的,不易於擴展。用戶 訪問數據的存儲方面,已有的方式主要分兩種:客戶端記錄,或在服務端用數據庫存儲。前者的訪問數據可能被篡改,有安全隱患;作為一種基礎功能模塊,后者的 做法代價較為昂貴,可能會占用大量的數據庫連接,降低業務處理能力。

        針對上述問題,本文提出一種輕型的訪問頻率限制服務模型(Access Frequency Restrict Service Model, AFRSM)。此模型本身是一種面向平台內部的私有服務接口。系統邊界以內的一切需要進行訪問頻率限制的模塊和對外服務接口均可通過簡單的協議共同使用此 服務(Frequency Restrict Service, FRS)。最終達到統一管理和使用訪問頻率限制服務的目的。


2.FRSM概述
2.1 架構
頻率限制服務(Frequency Restrict Service, FRS)作為CGI、Web-Service等公共服務接口的依賴服務,自身對性能有較高的要求。在設計模型時我們偏重其並發處理能力以及輕型的數據存儲。
FRS由三大塊組成:微服務器框架、MMAP文件群以及一組配置文件。其中服務器我們采用了並發度較高的epoll模型,除守護進程外還可配置n個子進程 進一步增加其並發性能。服務只處理兩種類型的請求:Query和Update,分別對應FRS的查詢接口和更新接口。公共服務(記為PS)通過FRS的查 詢接口可以獲知:當前用戶/當前IP是否仍對於該服務(PS)有使用權,如有權使用則表示該用戶在服務(PS)中沒有被限制;反之,則表示該用戶在服務 (PS)中已被約束。


在FRS的核心處理模塊中,包含了一些核心算法,用以訪問和更新MMAP文件群。
Config-Cache是FRS的重要組成部分之一,在守護進程啟動時,指定配置文件內容機會被緩存在中,之后每次訪問配置文件實際上都會在內存中命中 需獲取的配置項。配置文件在此分兩種類型:(1)服務器相關的配置(srv.xml),用於指定服務器的子進程數,所綁定的主機端口等;(2)業務配置 (map.xml),用於注冊各個業務的頻率限制細則:業務標識、時間間隔、間隔內最大訪問次數。


2.2協議
FRS采用TCP協議,並在此基礎之上構建應用層協議。由於FRS是內部服務,不對外公開,因此不存在數據包的保密問題;同時FRS屬於輕型服務,在一次服務請求過程中不會傳輸過多數據,因此不需要考慮數據包壓縮的問題。應用層協議的構建原則是:簡單並易於擴展。
HTTP-XML協議是我們所采用的應用層協議。即,使用HTTP頭描述數據包體的長度、請求命令類型等信息。具體請求/響應數據則采用XML協議描述,以便在此基礎上進行擴展修改。

2.3 部署與使用
FRS作為一種內部服務,其使用者是位於系統最外層的CGI、Web-Service、其他Server等公開服務接口。通用的HTTP-XML協議使得其它服務的邏輯中可以很方便實現對FRS的調用。
FRS的客戶端使用模式相對固定,主要分=兩個步驟: a. Query, b. Update.
當且僅當key在服務(BizID)中沒有被約束,調用者key才能繼續使用該業務,並在使用完畢后,必須更新記錄key對這次業務的使用情況
4 FRS使用模式
由於從步驟(02)開始需要依賴步驟(01)的結果,步驟(01)必須使用同步模式請求FRS。如該業務采用異步I/O模型[3]的可能在此進行特殊處理,采取局部的同步請求。

3.關鍵問題分析
3.1 泛型的鍵值索引
FRS中的訪問記錄我們采用輕型的MMAP存儲,使用時只需把文件數據映射到內存中即可。然而遍歷文件找到真正需要的數據是一項耗時的操作,尤其在文件較 大的情況下。為此,本文采用泛型的鍵值索引,將MMAP文件平均划分為m塊存儲區域(稱為關鍵節點,key-node),在目標數據存儲或檢索之前,預先 為其估算出一個關鍵節點,使MMAP可以快速定位到該區域。鍵值不同的數據有可能會被安排在同一個關鍵節點中,稱為估算沖突。沖突的數據會被安排在該關鍵 節點的一條沖突鏈上,進行小區域遍歷檢索。

上側描述的是單個MMAP文件存儲。垂直排布示意的是關鍵節點,與其緊連的是該節點的沖突鏈。沖突鏈是有長度限制的,因為m=1的極端情況下,沖突 鏈將占滿整個文件,檢索算法會退化為文件遍歷檢索。較為理想的情況是盡量減少沖突鏈的長度,盡可能一次命中。當某條沖突鏈用盡的時候,我們需要考慮采用淘 汰算法,將過期的節點抹掉/復用。假定允許的沖突長度為Length conflict (包含關鍵節點本身),每個節點存儲大小為size node,則可計算出MMAP文件的大小:
size MMAP = size node * Length conflict * m


上述的泛型是指FRS的擴展性。在FRS中通過編程擴展可以支持:以不同數據類型作為索引主鍵,只要實現該種數據類型的索引估算接口,和比較接口即可。其 中,索引估算接口在知道關鍵節點總量m的前提下,用來計算關鍵節點。如:Integer類型的鍵值可以采用求模運算得到關鍵節點索引,而String類型 則可以使用現成的Bob Hash算法[5];而比較接口則是在沖突鏈上用來進行鍵值比較,最終定位到目標數據。


MMAP集群由多個同構的MMAP文件構成。它適用於更大數據量存儲。假定一個MMAP群當中有n個存儲文件。即相當於將數據存儲容量擴展了n倍。根據上述說明,可得出總的數據存儲大小為
size MMAP = size node * Length conflict * m* n。


總體看來,使用MMAP群模式對數據進行存儲檢索,實際上使用了2級檢索:第一級,索引到文件;第二級,索引到關鍵節點。
為了使用方便,我們把上述對MMAP的訪問步驟封裝成一組操作:Init-MMAP、Find-Node、Erase-Node、Update-Node。由於MMAP是多進程共享訪問的,因此這些操作(尤其是修改文件數據的操作)都需要使用信號量互斥處理。
Init-MMAP:在守護進程啟動時,根據配置文件初始化MMAP/MMAP群的規模。
Create-Node:創建新節點。
Find-Node:找到目標數據節點。
Erase-Node:刪除目標節點。通常在淘汰處理時調用。
Update-Node:更新目標數據節點。

3.2 頻率限制
頻率限制是FRS的核心模塊之一。在保證它的有效性的前提下,我們盡量簡化了它的實現邏輯。它基於以下簡單的數據結構和算法(圖6):
其中Interval和Max分別是某業務ID所對應的時間間隔和限制次數(於配置文件中設定)。這兩個參數控制了個體在一個時間段內訪問業務的次數。
由算法可知,在Interval時間段內:
第1次訪問一個業務時,會通過FRS創建一個新的記錄節點(記為node),並把node.Start和node.End更新為當前時間戳,node.Count記為1圖6 頻率限制算法示意
第n次(n<=Max)訪問該業務,則保持node.Start不變,node.End更新為當前時間戳,node.Count記為n;
第n次(n> Max)訪問該業務,仍然繼續保持node.Start的值不變,node.End更新為當前時間戳,但由於node.Count已到達極限值,訪問被拒絕。
當且僅當,在下次訪問時滿足:解除時間間隔約束(node.end-node.start>=Interval)條件,node.start才會重 置為當前時間戳。回到處理第1次訪問邏輯的狀態。有兩種情況會促使FRS調用Create-Node去創建一個新節點:(1)第一次訪問;(2)因為節點 過舊而被淘汰,需要新建。

4.結束語
通過簡單的協議和高並發的服務器模型,我們在本文中把訪問頻率限制功能抽象成一種內部服務接口,並在實現中使用MMAP集群確保了其數據訪問存儲的輕型 性。在實際應用運營過程中,該服務模型可勝任10,000,000級別日訪問量的開放平台,保證了有效的服務質量以及系統安全。實踐表明,將平台內部功能 抽象為服務,能提高其應用服用程度,明顯降低了功能的維護和擴展成本,具有一定的推廣意義。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM