《大規模web服務開發技術》筆記


前段時間趁空把大規模web服務開發技術》這本書看完了,今天用一下午時間重新翻了一遍,把其中的要點記了下來,權當復習和備忘。由於自己對數據壓縮、全文檢索等還算比較熟,所以筆記內容主要涉及前5章內容,后面的零星記了一些。本文可能對如下人士比較有幫助:1、對這本書有興趣,但對內容存疑的;2、對大規模Web服務有一定經驗的,可對照着查漏補缺。

Hatena的規模(20104)

  • 注冊用戶150wUU1900w/
  • 請求數:幾十億/
  • 繁忙時流量:850Mbps(不含圖像)
  • 硬件(服務器)600台,通過虛擬化技術,主機超過1300
  • 日志每天幾GB級別,數據庫GBTB級別

系統增長的戰略

  • 最小化開端、預見變化的管理和設計

平衡效率和質量

  • 開會、規范化、文檔、敏捷等

GB級別(千萬)的文本數據庫,不用索引,一句select查詢200s也未能執行完

內存和硬盤的速度差異

  • 尋址:前者是后者的10w100w
  • 傳輸速度(總線):前者——7.5G/s,后者——58M/s

找尋單機瓶頸(用足單機的性能,不要推測,要測量)

  • sarvmstat查看是CPU問題還是IO問題
  • 若是CPU問題
    • topsar查看是系統進程還是用戶程序
    • ps查看進程狀態和cpu使用情況,確定問題進程
    • straceoprofile找出程序或進程的具體問題所在
  • 若是IO問題
    • 發生頻繁頁交換--->內存不足
      • ps查看程序所用內存
      • 能否改善程序,減少內存占用
      • 不行增加硬件或分布式
    • 若無,則可能是緩存的內存不夠
      • 增加內存
      • 不行就增加機器,分布式

CPU擴展比較方便,但IO負載的擴展比較困難

  • 查看實際負載:top結果中的load average1分鍾 5分鍾 15分鍾)
  • 查看是IO負載過高還是CPU負載過高:sar -P(多核)

 

處理大規模技術的重點

  • 盡量在內存中進行,可實現分布式,利用局部性
  • 算法的復雜度,O(n) --> O(logn)有質的飛躍
  • 數據壓縮和檢索技術

緩存機制

  • 頁面緩存(page cache
    • 現代操作系統均采用虛擬內存
    • 內核分配過的內存會盡量留下來,下次無需訪問磁盤,即頁面緩存
    • 操作系統以頁為單位緩存,即虛擬內存的最小單位
    • 增加內存可提高緩存的命中率,降低IO負載
  • sar命令
    • sar -r 即可查看當前的內存狀態(kbbuffered緩存使用的物理內存大小)
    • sar  1 3 一秒1次,總共3
    • sar -u 查看CPU使用率
    • sar -q 查看平均負載
    • sar -r 查看內存使用情況

降低IO負載的策略

  1. 提高緩存,即加內存
  1. 擴展到多台服務器
  1. 2實際可能未提高緩存命中率(每台機器的數據不變),需要切分(Partition)數據

切分(Partition)——利用局部性的分布式

  • RDBMS的表為單位
  • 從數據中間切分
    • a-c服務器1d-f服務器2……
    • 一致性哈希
  • 按用途將系統分成不同的“島”
    • 爬蟲
    • 圖像API
    • 一般訪問

以頁面緩存為基礎的基本運維規則

  • 操作系統啟動時不要馬上投入生產環境,要先預熱,即讀一遍所有文件
  • 性能測試要在緩存優化后進行

 

數據庫橫向擴展策略

靈活應用操作系統緩存

  • 盡量讓數據庫大小小於物理內存
  • 考慮表的結構設計對數據庫大小的影響

建立索引

  • B+
  • 提高搜索效率(logn),改善磁盤尋道次數
  • MySQLexplain命令幫助查看索引是否有效

MySQL的分布式

  • master/slave設計(master更新,slave讀)
    • 查詢可以擴展(slave
    • master無法擴展(數據一致性)
      • Web應用大多數情況下90%都是讀取查詢
      • master的負載可通過分庫分表或更換實現方法來解決

MySQLPartition

  • 將聯系不緊密的表放在不同機器上
  • 避免對不同機器上表進行JOIN操作
    • 使用INNER JOINwhere...in…
    • 使用自定義的ORM
  • Partition的代價
    • 運維變得復雜,故障率上升,成本上升
  • 實現冗余化最少需要多少台機器
    • 4台——1master3slave
    • 3slave中,一台用於提供持續服務,一台可能會故障,最后一台用於故障后復制

 

Web服務的基礎設施重視的三點

  1. 低成本、高效率
    • 不應追求100%可靠性
  1. 設計很重要
    • 可擴展性和響應時間
  1. 開發速度很重要
    • Web服務經常添加或更改功能,需為服務提供靈活的資源

 

一台服務器能處理的流量極限

  • Hatena標准服務器:4CPU8G內存;
  • 性能:繁忙時每分鍾幾千請求
  • 4CPU*232G內存
    • 100w~200wPV/

調優

  • 掌握負載
    • 服務器監控工具

 

冗余性與系統穩定性

master的冗余化

  • multi-master
    • 通常有兩台服務器,組成Active/Standby結構
    • 一台是Active的,另一台Standby
    • 兩台服務器互為slave,一方的寫入數據傳入另外一方,雙向replication
    • Standby通過VRRP協議發現Active停機,則Standby自動提升為Active,變成新的master
    • Active服務器有個虛擬ip,將此ip分配給哪台機器,哪台機器就是Activemaster
    • 缺點
      • 還是有不一致的風險

系統的穩定性

  • 資源應都保留一定余量,只用到70%左右
  • 去除不穩定因素(盡量自動化處理)
    • 規定SQL負載上限
    • 減少內存泄露,遇到可自動重啟
    • 異常行為的自律控制
      • 自動DOS判斷
      • 自動重啟
      • 自動終止耗時查詢

 

虛擬化技術

  • 好處
    • 可擴展性
      • 將額外開銷降至最低
      • 動態遷移
    • 性價比
      • 提高資源利用率
      • 提高運維的靈活程度
        • 軟件層面的主機控制
    • 高可用性
      • 環境隔離
  • Hatena的虛擬化應用
    • XenCentOS 5.2Xen 3.0.3+ 本地磁盤構建LVM
    • HyperVisor替代IPMI
    • 使用准虛擬化(ParaVirtualization
    • 控制資源消耗
      • 負載過高時警告
      • 調整負載
    • 檢測工具:monit
    • 提高資源利用率
      • CPU空閑 --> Web服務器
      • IO空閑 --> 數據庫服務器
      • 內存空閑 --> 緩存服務器
      • 避免消耗傾向相同的組合在一起
    • 虛擬化的額外開銷
      • CPU2%~3%
      • 內存性能:10%
      • 網絡性能:50%
      • IO性能:5%

SSD的壽命

  • 損耗程度指標:S.M.A.R.T值中的E9Media Wearout Indicator---> smartctl命令
  • Hatena寫入最頻繁的SSD用了9個月左右

 

網絡的分界點

  • 1Gbps,即30wpps,是PC路由器的極限(1Gbps是千兆以太網的界限,30wppsLinux內核的極限)
    • 對策:多個PC路由,購買昂貴成品路由
  • 500台主機,是子網、ARP表的極限
    • 對策:對網絡進行層次化

 

RDBMS還是k-v存儲

  • 判斷依據
    • 平均數據大小
    • 最大數據大小
    • 新數據增加頻率
    • 更新頻率
    • 刪除頻率
    • 訪問頻率
  • MyISAM vs. InnoDB
    • MyISAM
      • 優點
        • 未經updatedelete的表也能快速insert
        • 啟動、停止十分迅速
        • 表移動、改名稱可直接從文件系統中操作
      • 缺點
        • 異常停止可能會損壞表
        • 不支持事務
        • updatedeleteinsert(追加數據之外)會鎖表,在更新較多的應用中性能不好
      • 適合場景
        • 只有數據追加
        • 使用SELECT COUNT(*)
    • InnoDB
      • 優點
        • 支持事務
        • 異常停止恢復
        • 數據更新時執行行鎖定
      • 缺點
        • 啟動、停止慢
        • 表操作完全通過數據庫
      • 適合場景
        • 更新頻率高
        • 需要事務
  • 分布式k-v
    • memcached
    • TokyoTyrant

 

緩存系統

  • Squid
    • 用作HTTPHTTPSFTP等多種(反向)代理
    • 訪問控制、認證功能
  • Varnish
    • 高性能HTTP加速器
    • 靈活的設置語言
    • 基本完全在內存中執行
    • 速度比Squid
  • nginxpound……
  • 緩存服務器上線時注意
    • 兩台負載均衡時,一台故障會導致另一台無法承受負載
      • 備足服務器
    • 即使備足服務器也要注意
      • 新服務器(或剛啟動)要預熱,流量從小到大慢慢增大

 

 

 




免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM