整體架構圖
整體架構圖
集群節點、分片和副本

集群節點、分片和副本
數據邏輯結構圖

數據邏輯結構圖
存儲目錄結構圖

存儲目錄結構圖
總結:
1、index包含多個shard。
2、每個shard都是一個最小工作單元,承載部分數據,lucene實例,完整的建立索引和處理請求的能力。增減節點時,shard會自動在nodes中負載均衡。
3、primary shard和replica shard,每個document肯定只存在於某一個primary shard以及其對應的。replica shard中,不可能存在於多個primary shard。
4、replica shard是primary shard的副本,負責容錯,以及承擔讀請求負載。副本中的數據保證強一致或最終一致。
5、primary shard的數量在創建索引的時候就固定了,因為索引時,需要按照primary shard的數量為文檔做路由(默認使用文檔的_id屬性取哈希值做路由,也可以通過routing指定使用其他文檔字段取哈希值做路由)。replica shard的數量可以隨時修改。
6、primary shard的默認數量是5,replica默認是1,默認有10個shard,5個primary shard,5個replica shard。
7、primary shard不能和自己的replica shard放在同一個節點上(否則節點宕機,primary shard和副本都丟失,起不到容錯的作用),但是可以和其他primary shard的replica shard放在同一個節點上。