全局思維(核心網和無線基站側都會有信令風暴):
LTE網絡系統可能出現信令風暴的原因,大致可以總結出以下幾點:
1.網絡架構的變化,導致4G核心網信令流量較2G/3G大幅增加
a)架構扁平化:LTE網絡采用兩級結構,取消RNC(RadioNetworkController)/BSC(BaseStationController)中間的網絡節點,核心網直接管理無線基站。
b)尋呼信令激增:尋呼信令不再通過RNC/BSC匯聚,S1接口尋呼信令大增。
c)切換等其他信令也大幅增長:跨eNodeB的切換需要通過MME,切換信令大增。
2.信令流程和協議狀態變化,導致4G信令大幅增加,4G用戶狀態大為簡化,只有連接態和空閑態兩個狀態,而3G采用URA-FACH/PCH等狀態,無數據傳送時無需很快進入空閑態,導致LTE網絡中Service Request信令增加。
3.智能終端的普及和移動互聯網的飛速發展,移動用戶相關行為導致的網絡注冊,重注冊、請求位置更新、請求分配資源等服務流程的信令量大幅增加。
與傳統的因為大數據流量沖擊造成的網絡擁塞不同,因信令風暴而引發網絡擁塞時,此時實際承載數據流量的網絡資源大部分處於空閑狀態,但負責接納、管理 UE 的信令信道資源卻被消耗殆盡,導致網絡無法為新用戶提供服務。 需要說明的是,網絡信令交互可以分為兩大類:一類是核心網側信令交互,專指核心網元(如 MME 和 S-GW)與基站間的信令交互;另一類是接入網側的信令交互,專指 UE 與基站間的信令交互。在核心網側與接入網側均有可能出現網絡信令負荷過載的情況。
本文僅僅探討無線側的信令風暴(專指 UE 與基站間的信令)。
全球各個UMTS網絡中Iphone、Blackberry、Android、Nokia等智能3G終端的市場占有率逐漸上升,智能終端內置的部分PS應用程序(IM,Mail類軟件)會以較短的周期與Internet服務器頻繁同步通信,造成大量PS呼叫並且單次PS呼叫的數據量較小。部分智能終端為了節約電量消耗在與服務器通信完成后會主動發送SIGNALLING CONNCETION RELEASE INDICATION信令給RNC來釋放RRC連接,於是每到同步周期此類終端都會進行RRC接入->同步PS數據->RRC釋放一整套流程,頻繁的接入釋放產生大量信令。
這種由於智能終端業務特點引發的大信令流量,對RNC的SPU單板和PIU單板和NodeB基帶單板的CPU處理能力消耗增多,而且對運營商並不帶來業務收入。有部分局點由於未能及時對智能終端信令風暴采取應對措施,而出現了RNC或者NodeB 的CPU過載問題,嚴重影響網絡的容量和穩定性。
此外,由於智能終端的數據小、連接時間短且非常頻繁的特點,直接導致空口的尋呼次數大大增加。通過對當前如加拿大或新加坡等典型網絡分析之后發現,在網絡話務量基本不變的前提下,PS尋呼每隔幾個月就成倍增長,總的尋呼量很快就會達到控制器的容量上限。如果網絡側不改進,可以預期將來尋呼信道必然面臨崩潰。
1.1 應用場景
根據信令觸發源的不同,信令風暴解決方案的應用場景可分為接入信令風暴場景,小區重選信令風暴場景和尋呼信令風暴場景。
(1)接入信令風暴場景
對於大量的PS RAB接入信令,可以通過使用PCH/R8 FD/EFD功能來從源頭上減少接入信令,R8 FD/EFD功能使得RNC在接收到終端發送的SCRI信令后,不釋放RRC連接,而是將終端遷移到CELL_FACH/PCH,這樣大大減少了PS RAB接入信令
(2)小區重選信令風暴場景
在使用CELL_PCH方案后,在高移動性場景中,會帶來小區重選信令的大量增多,可以通過URA_PCH來解決,即將某些移動性高的小區規划到一個URA區中,這樣來減少終端移動帶來的小區更新信令。用戶在小區間移動需要發送小區重選信令。
(3)尋呼信令風暴場景
對於尋呼信令多的場景,通過URA_PCH態分級尋呼和IDLE態分級尋呼來解決。在智能UE滲透率不斷上升的場景下,越來越多的業務會引起尋呼,特別是PS尋呼。當現網的空口尋呼量比較大(PCH物理信道利用率大於60%)。
小區尋呼信道擁塞.本特性通過對處於IDLE狀態的UE實現兩級尋呼機制:
第一級尋呼:首先在最近活動小區及其鄰區內尋呼。
第二級尋呼:在尋呼無響應的情況下再在LA/RA全小區進行尋呼。
這樣,有效的減少全系統尋呼量,避免尋呼信道的擁塞。
補充5G相關基礎知識:
UE:用戶設備,一般是手機或者物聯網終端。
(1)5G空口協議:
制面協議棧和用戶面協議棧共同構成了 LTE 的空口無線協議棧,具體又包括物理層(PHY),媒介接入控制中心層(MAC),分組數據匯聚層(PDCP),無線鏈路控制層(RLC)和無線資源控制層(RRC)。
RRC 層:作為整個 LTE 系統的控制實體,完成了包括系統信息廣播,尋呼,RRC 連接建立、釋放、配置、重建立,無線承載的管理,信令消息的加密與安全控制,切換與測量上報等功能。
PDCP 層:該層主要負責對數據進行處理,包括對用戶面和控制面的數據進行完整性保護,加密解密處理,重復數據丟棄等功能。
RLC 層:該層主要負責保證上層消息分組的可靠傳輸,其具體功能包括數據分組的級聯、分段和重組,分組的重復檢查和順序遞交等。
MAC 層:該層主要完成邏輯信道與傳輸信道的映射,上層協議數據單元的復用和解復用,隨機接入過程,測量和上報,HARQ 糾錯,UE 優先級管理等功能。 PHY 層:該層完成實際數據的收發工作,具體功能包括傳輸信道的錯誤檢測、糾錯編碼與譯碼,傳輸信道向屋里信道的映射,調制與解調,頻率與時間的同步,多天線處理等。
RRC 協議位於 E-UTRAN 的控制平面,其所完成的功能可簡要分類概括如下[11]: 廣播系統信息:廣播包括接入層及 NAS 層的系統信息廣播。 尋呼:包括主動尋呼和被動尋呼。UE 高層在收到尋呼消息后可以發起 RRC連接。 RRC 連接控制:包括 RRC 連接建立/重建立/重配置/釋放。 無線承載管理:信令無線承載(SRB)、數據無線承載(DRB)的建立、配置、釋放。 安全機制:密鑰的管理等。 移動性管理:UE 進行切換時的小區選擇及重選、上下文信息的傳輸,UE的測量上報等。
在 LTE 系統中同樣存在出現網絡信令過載的問題,其原因大致可以歸為以下三類: 1) 協議設計的原因 從上一節關於 LTE 系統關鍵技術的概述中可知,LTE 系統的無線資源控制層(RRC)存在狀態轉換機制。UE 在接入網絡成功后會駐留在 RRC 空閑態,此時UE 僅擁有接受尋呼消息、廣播消息等有限功能,無法進行用戶數據的收發。當UE 有用戶數據達到時就必須將狀態切換到 RRC 連接態,這一過程伴隨着核心網側和接入網側的諸多信令交互,其信令交互流程如圖 2-9 所示。UE 在進入 RRC連接態后可以進行持續的數據收發,但此時處於高能耗狀態且持續占用網絡時頻資源(所以上網過程是很耗電的),因此 LTE 協議設定了一個 RRC 連接釋放定時器,當 UE 處於 RRC 連接態且在上述定時器超時之前都沒有用戶數據的收發,則網絡側會主動釋放該 UE 的RRC 連接[16]。由此可知,RRC 連接釋放定時器的取值與 UE 所發生的 RRC 狀態轉換次數緊密相關。具體而言,當設置較大的 RRC 連接釋放定時器值時,UE 在通信過程中發生 RRC 狀態轉換的頻次將明顯降低,相反,較小的 RRC 連接釋放定時器值則會導致較為頻繁的 RRC 狀態轉換。 然而問題就出現在在新興的移動互聯網業務應用沖擊下,這種 RRC 連接建立與釋放機制會被頻繁觸發,每次觸發都會伴隨着如圖 2-9 所示的十幾個交互流程,而每個交互流程都會在核心網側或接入網側產生數條甚至數十條信令交互。這種頻繁的 RRC 狀態轉換正是當前頻繁爆發的信令風暴問題的根源。
2) 移動數據業務流量特征的原因 由上述分析可知,網絡信令風暴的一個重要原因在於頻繁的 RRC 狀態轉換,而 RRC 狀態轉換的發生與 UE 所運行的移動數據業務的流量特征密切相關。隨着移動互聯網的快速發展,許多新的移動數據業務開始出現,這些新業務相比於電話、網頁瀏覽等傳統業務,其應用特征大大不同:實時在線,頻繁的網絡連接,頻繁突發的小數據包傳輸等。移動 QQ、微信等是該類特征應用的典型代表。而且這些應用還附帶有背景流量以及心跳信息,這更是加劇了 RRC 狀態轉換的頻繁發生。 由參考文獻[17]可知,背景流量和心跳信息等頻繁的小數據包傳輸不僅導致了頻繁的 RRC 狀態轉換,還降低了網絡資源的利用效率,因為一次小數據包傳輸和一次連續的大數據量傳輸需要消耗的信令資源幾乎相同(一次 RRC 狀態轉換),但論傳輸效率(數據流量/信令流量)比率,前者則大大低於后者。這就意味着網絡中控制信道的信令資源被大量小數據包傳輸所消耗,但實際所傳輸的用戶數據流量卻很少,網絡資源的利用效率低下。
3) 信令攻擊的原因 任何人為設計的協議難免總會存在漏洞,一些惡意的用戶就會利用這些漏洞發起攻擊為自身牟利。LTE 協議同樣存在一些考慮不全的地方,也難以避免被發起攻擊。有部分信令風暴問題便是這些惡意用戶所發起的信令攻擊。 參考文獻[18]給出了一種針對 LTE 系統的信令攻擊方式。在這種攻擊方式中,攻擊者利用了建立與拆除專用承載需要消耗大量信令資源這個特點。攻擊者通過同時向網絡申請建立大量專用承載,而后在承載建立完成后不去使用,直到網絡側因為這些專用承載超時而選擇拆除它們。攻擊者只需要不斷重復上述過程就可達到放大攻擊效果,最終造成網絡信令負荷過載的目的。
(2)RNC和E NodeB:
演進節點B(Evolved Node B),也被稱為E-UTRAN節點B(E-UTRAN Node B),其英文縮寫為eNodeB或者eNB。其為LTE系統中E-UTRAN的組成部分,是對於UMTS系統中節點B部分的演進。該設備是用於在移動網絡中,連接用戶手機和移動電話網絡之間的硬件設備。其功能類似於GSM網絡中的BTS。
傳統上,節點B具有最小的功能設置,並由RNC(無線網絡控制器)進行控制。然而,eNB沒有單獨的控制器元件。這簡化了系統架構,並且可以提供較低的網絡響應時間。
從前文的介紹中可知 UE 頻繁的 RRC 狀態轉換過程是導致信令風暴問題的一個主要原因,那么一次 RRC 狀態轉換到底會消耗多少信令資源?參考文獻[13]對此進行了實際的仿真與數據收集,假設所有的信令消息在收發過程均不存在差錯,那么一次 RRC 連接建立與釋放過程所消耗的信令資源如表 2-1 所示。
從上表可知, 一次 RRC 連接釋放與建立會產生數十條信令消息。假設一個基站在繁忙時段需要同時為眾多 UE 服務,而每個 UE 又頻繁的發生 RRC 狀態轉換,此時網絡內傳輸的信令消息將會消耗掉大量網絡資源,出現網絡信令過載,最終導致網絡擁塞。