ZooKeeper日志與快照文件簡單分析


有用過Zookeeper的都知道zoo.cfg配置文件中有dataDir配置項用於存儲數據,不過可能有些人不太清楚這個目錄具體存儲的是那些數據,默認情況下這個目錄是用於存儲Log(事務日志)與Snapshot(快照)數據,但是Zookeeper還提供了一個用於Log存儲目錄的配置項dataLogDir而dataDir用於存儲Snapshot數據,Log文件寫入頻率非常高如果有對Snapshot文件經常操作或是對Zookeeper性能要求非常高可以為Log與Snapshot分別配置不同的目錄存儲;本文主要是結合源碼分析Zookeeper的Log與Snapshot文件,這里我分別為Log與Snapshot配置了不同的存儲目錄:dataDir=D:/zookeeper-3.4.6/data 、dataLogDir=D:/zookeeper-3.4.6/data/log;
  事務日志與Snapshot的操作是在org.apache.zookeeper.server.persistence包中,這里也主要是分析該包下的各個類;在FileTxnSnapLog類中看到了它在我們為事務日志與Snapshot配置的目錄下又創建了一個子目錄version-2同時又指定為該兩種文件的存儲目,在里面還可以看到FileTxnLog、FileSnap類分別為處理事務日志和Snapshot的;

事務日志文件

  在Zab協議中我們知道每當有接收到客戶端的事務請求后Leader與Follower都會將把該事務日志存入磁盤日志文件中,該日志文件就是這里所說的事務日志,下面將詳細分析該日志文件;
  FileTxnLog類用於處理事務日志文件這里就從此類開始,在該類中看到了preAllocSize、TXNLOG_MAGIC、VERSION、lastZxidSeen、dbId等這樣的屬性:
  1. preAllocSize: 默認預分配的日志文件的大小65536*1024字節
  2. TXNLOG_MAGIC:日志文件魔數為ZKLG
  3. VERSION:日志文件版本號2
  4. lastZxidSeen:最后的ZXID

  類中還有一個靜態代碼塊用於讀取配置項中的preAllocSize,也就是說預分配的日志文件大小是可配置的,接下來看看該類中最重要的一個方法append,該方法主要功能是創建新的日志文件與往日志文件中追加新的事務日志記錄;從中可以看到日志文件的相關信息

  1. 文件名為log,后綴為十六進制的ZXID
  2. 日志文件頭有:magic、version、dbid
  3. 創建文件后分配的文件大小為:67108864字節+16字節,其中16字節為文件頭
  4. 使用Adler32作為日志文件的校驗碼
  5. 當日志文件寫滿預分配大大小后就擴充日志文件一倍大小


        1.1 日志文件目錄

  正如從代碼中看到的一樣version-2目錄中存儲着Zookeeper的事務日志文件,有看到log.10、log.4f文件,這些都是Zookeeper的事務日志文件;這兩個文件都有一個特點就是文件名為log.xx,大小為64MB文件的后綴xx時間最早的 數字總是比最晚的小。如果有了解過Zookeeper的ZAB協議那肯定知道它為每一個事務請求都分配了一個事務ID也就是ZXID,上面章節也知道了xx就是Zookeeper處理請求的ZXID,該ZXID為log文件中第一條事務的ZXID;ZXID規則為前32 字節為Leader周期,后32字節為事務請求序列,所以通過事務日志就可以輕松的知道當前的Leader周期與每個文件所屬的Leader周期;

日志文件可視化
  事務日志文件中存儲的都是二進制的數據,如果不借助其他工具是很難知道里面存儲的內容的,Zookeeper也給我們提供了這樣的工具,在org.apache.zookeeper.server包中的LogFormatter類為我們提供了把事務日志文件以我們看得懂的數據輸出的功能,這里就使用該工具輸出該事務日志文件,並解釋該數據;
  LogFormatter工具的使用方法: java -cp ../../../zookeeper-3.4.6.jar:../../../lib/slf4j-api-1.6.1.jar org.apache.zookeeper.server.LogFormatter log.1

日志分析
  第一行:ZooKeeper Transactional Log File with dbid 0 txnlog format version 2
  上面的代碼分析中有說到每個日志文件都有一個這就是那里所說的日志頭,這里magic沒有輸出,只輸出了dbid還有version;

  第二行:15-8-12 下午03時59分53秒 session 0x14f20ea71c10000 cxid 0x0 zxid 0x1 createSession 4000
  這也就是具體的事務日志內容了,這里是說xxx時間有一個sessionid為0x14f20ea71c10000、cxid為0x0、zxid為0x1、類型為createSession、超時時間為4000毫秒

  第三行:15-8-12 下午03時59分54秒 session 0x14f20ea71c10000 cxid 0x1 zxid 0x2 create '/solinx0000000000,#736f6c696e78,v{s{31,s{'world,'anyone}}},F,1
  sessionID為0x14f20ea71c10000,cxid:0x01、zxid:0x02、創建了一個節點路徑為:/solinx0000000000、節點內容為:#736f6c696e78(經過ASCII,實際內容為solinx)、acl為world:anyone任何人都可以管理該節點、節點不是ephemeral節點的、父節點子版本:1

  第四行:15-8-12 下午04時15分56秒 session 0x14f20ea71c10000 cxid 0x0 zxid 0x3 closeSession null
  這里是說xxx時間有一個sessionid為0x14f20ea71c10000、cxid為0x0、zxid為0x3、類型為closeSession

快照文件

  快照文件的處理在FileSnap類中,與事務日志文件一樣快照文件也一樣有SNAP_MAGIC、VERSION、dbId這些,這作用也只是用來標識這是一個快照文件;Zookeeper的數據在內存中是以DataTree為數據結構存儲的,而快照就是每間隔一段時間Zookeeper就會把整個DataTree的數據序列化然后把它存儲在磁盤中,這就是Zookeeper的快照文件,快照文件是指定時間間隔對數據的備份,所以快照文件中數據通常都不是最新的,多久抓一個快照這也是可以配置的snapCount配置項用於配置處理幾個事務請求后生成一個快照文件;
  與事務日志文件一樣快照文件也是使用ZXID作為快照文件的后綴,在FileTxnSnapLog類中的save方法中生成文件並調用FileSnap類序列化DataTree數據並且寫入快照文件中;


        1.2 快照文件目錄

快照文件可視化
  與日志文件一樣Zookeeper也為快照文件提供了可視化的工具org.apache.zookeeper.server包中的SnapshotFormatter類,接下來就使用該工具輸出該事務日志文件,並解釋該數據;
  SnapshotFormatter工具的使用方法: java -cp ../../zookeeper-3.4.6.jar:../../lib/slf4j-api-1.6.1.jar org.apache.zookeeper.server.SnapshotFormatter snapshot.17


快照分析
  快照文件就很容易看得懂了,這就是Zookeeper整個節點數據的輸出;

  第一行:ZNode Details (count=11):
  ZNode節點數總共有11個

  /cZxid = 0x00000000000000
  ctime = Thu Jan 01 08:00:00 CST 1970
  mZxid = 0x00000000000000
  mtime = Thu Jan 01 08:00:00 CST 1970
  pZxid = 0x00000000000016
  cversion = 7
  dataVersion = 0
  aclVersion = 0
  ephemeralOwner = 0x00000000000000
  dataLength = 0

這么一段數據是說,根節點/:
  cZxid:創建節點時的ZXID
  ctime:創建節點的時間
  mZxid:節點最新一次更新發生時的zxid
  mtime:最近一次節點更新的時間
  pZxid:父節點的zxid
  cversion:子節點更新次數
  dataVersion:節點數據更新次數
  aclVersion:節點acl更新次數
  ephemeralOwner:如果節點為ephemeral節點則該值為sessionid,否則為0
  dataLength:該節點數據的長度

快照文件的末尾:
  Session Details (sid, timeout, ephemeralCount):   0x14f211584840000, 4000, 0   0x14f211399480001, 4000, 0
  這里是說當前抓取快照文件的時間Zookeeper中Session的詳情,有兩個session超時時間都是4000毫秒ephemeral節點為0;


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM