前言:現在的大多數移動端應用都有實時得到消息的能力,簡單來說,有發送消息的主動權和接受消息的被動權。例如:微信,QQ,天氣預報等等,相信好處和用戶體驗相信大家都知道吧。
提出問題:這種功能必須涉及client(客戶端)和server(服務器),所以到底client如何和server實現實時連接通訊?
分析問題:這種功能實際上就是數據同步,同時要考慮手機本身、電量、網絡流量等等限制因素,所以通常在移動端上有一下兩個解決方案:
1.一種是定時去server查詢數據,通常是使用HTTP協議來訪問web服務器,稱Polling(輪詢);
2.還有一種是移動端和服務器建立長連接,使用XMPP長連接,稱Push(推送)。(按照本人理解:客戶端的實現時:
1 while(true) { 2 3 request(timeout); 4 5 request(timeout); 6 7 }
客戶端發出一個“長”請求,如果服務器發送消息或者時間out了,客戶端就斷開這個請求,再建立一個長請求
)
從耗費的電量、流量和數據延遲性各方面來說,Push有明顯的優勢。但是使用Push的缺點是:
對於客戶端:實現和維護相對成本高,在移動無線網絡下維護長連接,相對有一些技術上的開發難度。
對於服務器:如何實現多核並發,cpu作業調度,數量龐大的長連接並發維護等技術,仍存在開發難點。
在講述Push方案的原理前,我們先了解一下移動無線網絡的特點。
移動無線網絡的特點:
因為 IP v4 的 IP 量有限,運營商分配給手機終端的 IP 是運營商內網的 IP,手機要連接 Internet,就需要通過運營商的網關做一個網絡地址轉換(Network Address Translation,NAT)。簡單的說運營商的網關需要維護一個外網 IP、端口到內網 IP、端口的對應關系,以確保內網的手機可以跟 Internet 的服務器通訊
原理圖如下:
GGSN(Gateway GPRS Support Node 網關GPRS支持結點)模塊就實現了NAT功能。
因為大部分移動無線網絡運營商都是為了減少網關的NAT映射表的負荷,所以如果發現鏈路中有一段時間沒有數據通訊時,會刪除其對應表,造成鏈路中斷。(關於NAT的作用及其原理可以查看我的另一篇博文:關於使用UDP(TCP)跨局域網,NAT穿透的心得)
Push在Android平台上長連接的實現:
既然我們知道我們移動端要和Internet進行通信,必須通過運營商的網關,所以,為了不讓NAT映射表失效,我們需要定時向Internet發送數據,因為只是為了不然NAT映射表失效,所以只需發送長度為0的數據即可。
這時候就要用到定時器,在android系統上,定時器通常有一下兩種:
1.java.util.Timer
2.android.app.AlarmManager
分析:
Timer:可以按照計划或者時間周期來執行相關的任務。但是Timer需要用WakeLock來讓CPU保持喚醒狀態,才能保證任務的執行,這樣子會消耗大量流量;當CPU處於休眠的時候,就不能喚醒執行任務,所以應用於移動端明顯是不合適。
AlarmManager:AlarmManager類是屬於android系統封裝好來管理RTC模塊的管理類。這里就涉及到RTC模塊,要更好地了解兩者的區別,就要明白兩者真正的區別。
RTC(Real- Time Clock)實時鬧鍾在一個嵌入式系統中,通常采用RTC 來提供可靠的系統時間,包括時分秒和年月日等;而且要求在系統處於關機狀態下它也能夠正常工作(通常采用后備電池供電),它的外圍也不需要太多的輔助電路,典型的就是只需要一個高精度的32.768KHz 晶體和電阻電容等。(如果對這方面感興趣,可以自己查閱相關資料,這里就說個大概)
好了,回來正題。所以,AlarmManager又稱全局定時鬧鍾。這意味着,當我用使用AlarmManager來定時執行任務,CPU可以正常地休眠,只有在執行任務是,才喚醒CPU,這個過程是很短時間的。
下面簡單來說明其使用:
1.類似於Timer功能:
//獲得鬧鍾管理器
AlarmManager am = (AlarmManager)getSystemService(ALARM_SERVICE);
//設置任務執行計划
am.setRepeating(AlarmManager.ELAPSED_REALTIME, firstTime, 5*1000, sender);//從firstTime才開始執行,每隔5秒再執行
2.實現全局定時功能:
//獲得鬧鍾管理器
AlarmManager am = (AlarmManager)getSystemService(ALARM_SERVICE);
//設置任務執行計划
am.setRepeating(AlarmManager.ELAPSED_REALTIME_WAKEUP, firstTime, 5*1000, sender);//從firstTime才開始執行,每隔5秒再執行
總結:在android客戶端使用Push推送時,應該使用AlarmManager來實現心跳功能,使其真正實現長連接。
在服務器端的實現:
在服務器端,可以使用很多語言來實現,如C/C++,java,Erlang等等,如我們國內比較好的極光推送(C開發),openfire(java開發)等等。
最近我看了極光推送的介紹和原理,下面我就說說他們是遇到什么難題,然后使用什么技術或者方案來解決呢。
當有大量的手機終端需要與服務器維持長連接時,對服務器的設計會是一個很大的挑戰。
假設一台服務器維護10萬個長連接,當有1000萬用戶量時,需要有多達100台的服務器來維護這些用戶的長連接,這里還不算用於做備份的服務器,這將會是一個巨大的成本問題。那就需要我們盡可能提高單台服務器接入用戶的量,也就是業界已經討論很久了的 C10K 問題。
C2000K
針對這個問題,他們專門成立了一個項目,命名為C2000K,顧名思義,他們的目標是單機維持200萬個長連接。最終他們采用了多消息循環、異步非阻塞的模型,在一台雙核、24G內存的服務器上,實現峰值維持超過300萬個長連接。
最后總結:
因為我最近用java在做一個PC、服務器、android的即時通訊系統(說白了就是模仿QQ,后面希望有不同的功能)。我的原則是用別人的原理,自己來實現,這樣才更好深入了解一些框架。所以,估計難點是在通訊開發和服務器上的開發,必須深刻了解多消息循環、異步非阻塞的模型。之后我會發表關於這方面的實現。
在現在的android平台上,已經不是android單機的世界了(我不是說做單機游戲沒有前途)。現在都是依靠發展蓬勃的互聯網來支撐整個IT體系,所以,要成為一個android應用開發高手,必須朝着android、硬件、雲服務這一體系來發展。
參考文檔:http://blog.csdn.net/sunmenggmail/article/details/12008075