用PHP如何打造一個高可用高性能的網站


1. 說到高可用的話要提一下redis,用過的都知道redis是一個具備數據庫特征的nosql,正好彌補了PHP的瓶頸,個人認為PHP的 瓶頸在於數據庫,像Apache和Nginx的高級web服務器在承受並發量上面都各有千秋,apache的最大承受並發數可以到三四千個,nginx要是它的10倍。

但apache的三四千個是實打實的三四千個,nginx的並發數是要依靠緩存的。高可用高性能系統這些就要求對mysql的掌握程度相當高,包括memcached,這會大大提高PHP的可擴展性。

 

之前模擬過一個高並發的單進程模型(這個對PHP的其它備用緩存的掌握程度有一定要求,有興趣的可以自己也試下哦!),在並發數達到一定峰值,PHP的某些小小的缺點就會暴露出來。

例如異步並發時數據庫反應時間不能及時響應導致PHP的處理時間超時問題,swoole的出現對於PHP來說無異於如虎添翼,再將字符串的值放進redis的隊列通過點對點的響應進行異步處理來模擬整個過程,其實也不是特別的簡單啦,Linux的強大就在於此處,只要你有想法就一切就可以滿足你!

 

好啦,話不多說,我們來分析分析高性能高可用的系統。

簡而言之,采用分布式系統,分布式應用和服務,分布式數據和存儲,分布式靜態資源,分布式計算,分布式配置和分布式鎖。負載均衡,故障轉移,實現高並發。

1、分層

分層是企業應用系統中最常見的一種架構模式,將系統在橫向維度上切分成幾個部分,每個部分負責一部分相對簡單並比較單一的職責,然后通過上層對下層的依賴和調度組成一個完整的系統。

在網站的分層架構中,常見的為3層,即應用層、服務層、數據層。

應用層,具體負責業務和視圖的展示;

服務層,為應用層提供服務支持;

數據層,提供數據存儲訪問服務,如數據庫、緩存、文件、搜索引擎等。

分層架構是邏輯上的,在物理部署上,三層架構可以部署在同一個物理機器上,但是隨着網站業務的發展,必然需要對已經分層的模塊分離部署,即三層結構分別部署在不同的服務器上,使網站擁有更多的計算資源,以應對越來越多的用戶訪問。

所以,雖然分層架構模式最初的目的,是規划軟件清晰的邏輯結構,以便於開發維護。但在網站的發展過程中,分層結構對網站支持高並發,向分布式方向的發展至關重要。

2、冗余

網站需要7×24小時連續運行,那么就得有相應的冗余機制,以防某台機器宕掉時無法訪問,而冗余則可以通過部署至少兩台服務器構成一個集群實現服務高可用。數據庫除了定期備份還需要實現冷熱備份。甚至可以在全球范圍內部署災備數據中心。

3、分隔

如果說分層是將軟件在橫向方面進行切分,那么分隔就是在縱向方面對軟件進行切分。

網站越大,功能越復雜,服務和數據處理的種類也越多,將這些不同的功能和服務分隔開來,包裝成高內聚低耦合的模塊單元,不僅有助於軟件的開發維護也便於不同模塊的分布式部署,提高網站的並發處理能力和功能擴展能力。

大型網站分隔的粒度可能會很小。比如在應用層,將不同業務進行分隔,例如將購物、論壇、搜索、廣告分隔成不同的應用,有對立的團隊負責,部署在不同的服務器上。

4、異步

使用異步,業務之間的消息傳遞不是同步調用,而是將一個業務操作分成多個階段,每個階段之間通過共享數據的方法異步執行進行協作。

具體實現則在單一服務器內部可用通過多線程共享內存的方式處理;在分布式系統中可用通過分布式消息隊列來實現異步。

異步架構的典型就是生產者消費者方式,兩者不存在直接調用。

5、分布式

對於大型網站,分層和分隔的一個主要目的是為了切分后的模塊便於分布式部署,即將不同模塊部署在不同的服務器上,通過遠程調用協同工作。分布式意味着可以使用更多的計算機完同樣的工作,計算機越多,CPU、內存、存儲資源就越多,能過處理的並發訪問和數據量就越大,進而能夠為更多的用戶提供服務。

在網站應用中,常用的分布式方案有一下幾種.

分布式應用和服務:將分層和分隔后的應用和服務模塊分布式部署,可以改善網站性能和並發性、加快開發和發布速度、減少數據庫連接資源消耗。

分布式靜態資源:網站的靜態資源如JS、CSS、Logo圖片等資源對立分布式部署,並采用獨立的域名,即人們常說的動靜分離。靜態資源分布式部署可以減輕應用服務器的負載壓力;通過使用獨立域名加快瀏覽器並發加載的速度。

分布式數據和存儲:大型網站需要處理以P為單位的海量數據,單台計算機無法提供如此大的存儲空間,這些數據庫需要分布式存儲。

分布式計算:目前網站普遍使用Hadoop和MapReduce分布式計算框架進行此類批處理計算,其特點是移動計算而不是移動數據,將計算程序分發到數據所在的位置以加速計算和分布式計算。

6、安全

網站在安全架構方面有許多模式:通過密碼和手機校驗碼進行身份認證;登錄、交易需要對網絡通信進行加密;

為了防止機器人程序濫用資源,需要使用驗證碼進行識別;對常見的XSS攻擊、SQL注入需要編碼轉換;垃圾信息需要過濾等。

7、自動化

具體有自動化發布過程,自動化代碼管理、自動化測試、自動化安全檢測、自動化部署、自動化監控、自動化報警、自動化失效轉移、自動化失效恢復等。

8、集群

對於用戶訪問集中的模塊需要將獨立部署的服務器集群化,即多台服務器部署相同的應用構成一個集群,通過負載均衡設備共同對外提供服務。

服務器集群能夠為相同的服務提供更多的並發支持,因此當有更多的用戶訪問時,只需要向集群中加入新的機器即可;

另外可以實現當其中的某台服務器發生故障時,可以通過負載均衡的失效轉移機制將請求轉移至集群中其他的服務器上,因此可以提高系統的可用性。

9、緩存

緩存目的就是減輕服務器的計算,使數據直接返回給用戶。在現在的軟件設計中,緩存已經無處不在。具體實現有CDN、反向代理、本地緩存、分布式緩存等。

使用緩存有兩個條件:訪問數據熱點不均衡,即某些頻繁訪問的數據需要放在緩存中;數據在某個時間段內有效,不過很快過期,否在會因為數據過期而臟讀,影響數據的正確性。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM