有時候啊,HBase表的設計方案通常,還會考慮如下一些因素,當然,這只是考慮范圍里的部分呢。
更多的行還是更多的版本?后者使用了HBase自帶的功能。但是需要在列簇中定義最大版本數,這樣做可能有風險。最好的做法是版本使用多行存儲,這需要把時間戳作為行鍵的一部分,數據檢索模式定義了時間戳如何定義為行鍵的一部分以及應該位於行鍵的一部分。
更多行或是每行包含更多列?HBase支持每行包含數百萬列,並且每一列都可以有列標識。
以行為列的設計?這是一種介於多行和多列的折衷方案。我們可以舉一個日志數據庫的例子,這個數據庫中存儲了所有系統中機器生成的日志。我們可以將系統標識(產生日志的系統)和時間范圍(比如間隔15分鍾)聯合起來定義行,每一列代表一種日志事件。
