Cassandra監控 - OpsCenter手冊


注:本文轉自:http://eric100.blog.51cto.com/2535573/1717792

Opscenter用戶手冊

1.       OpsCenter簡介

DataStaxOpsCenter是一個可視化管理和監控Apache Cassandra和DataStax Enterprise工具。OpsCenter簡化了管理任務:

  • 添加擴展集群

  • 配置nodes

  • 查看性能指標

  • 修復問題

  • 監控集群情況

  • 主要功能

OpsCenter主要功能如下:

Dashboard 

概述顯示任何警報和多個集群的儀表板。

儀表板顯示性能指標監測的概況。

可以在儀表板中添加和編輯圖表。

配置管理

基本的集群配置。

管理任務,比如使用簡單的單擊操作添加集群。

可視化的集群配置。

使用agent管理多個集群。

多個node管理。

下載PDF的集群報告。

only企業版的功能

僅支持DataStax Enterprise版本。

監控DSE內存tables的功能。

查看spark console。

主備切換,自動失效轉移。

安全,可以定義用戶角色。

DSE管理服務:

  • Backup服務 – 允許自動或手動備份。

  • Repaire服務 – 執行修復操作在DSE集群。

  • Capacity服務 – 監控集群性能,預測性能趨勢。

  • Best Practice服務 – 執行預定義的best practice規則,校驗集群環境的變量屬性。

  • 性能服務 – 監控能行指標,並通過提示建議快速修復問題

告警:

  • 內置通知功能。

  • warning告警

  • 從Cassandra,Analytics和Search nodes收集指標,並存儲在OpsCenter創建的keyspace中。

批量管理多個節點。

當新node添加或刪除時,Rebalance數據。

生成診斷的tarball,支持問題的排除。

Hadoop Job  Tracker集成。

查看過去一周的歷史指標。

1.2.    OpsCenter架構概覽

通過Cassandra和DataStaxEnterprise安裝DataStax agents。Agents使用Java Management Extensions (JMX)來監控管理每個node。

wKioL1ZZV9ihlrfoAACM3KKXmuI609.png

2.       安裝OpsCenter

2.1.    准備

最小的硬件環境:

  • 2 CPU cores

  • 2 GB of RAM available to OpsCenter

權限和軟件環境:

  • 如果希望對配置的values加密,需安裝pycryptolibrary

  • 安裝JRE或JDK。

  • 建議使用最新版本的瀏覽器。OpsCenter不支持InternetExplorer和 Microsoft Edge。

  • Python 2.6+

 

2.2.   安裝步驟

1、下載OpsCenter

$ curl -Lhttp://downloads.datastax.com/community/opscenter.tar.gz | tar xz

文件已包含DataStaxagent。

2、進入opscenterversion_number目錄

$ cd opscenter-version_number

3、啟動OpsCenter

$ bin/opscenter

注意:使用bin/opscenter –f是在前台啟動

4、瀏覽器打開OpsCenter

http://opscenter-host:8888/

3.       安裝DataStax agents

通過OpsCenter添加完集群之后,會在Dashboard上顯示agents狀態。

OpsCenter會嘗試自動安裝agents,如果失敗需要在每個節點上手動安裝。

3.1.    前置條件

  • Root或sudo安裝agents。

  • JMX連接可用在集群節點上。

  • SSH可用。

  •   OpsCenter診斷tarball特性需要GNU1.16版本以上。CentOS/RHEL需要6以上。

3.2.    步驟

1、打開瀏覽器,訪問http://opscenter_host:8888

http://1.2.3.4:8888/

當首次開啟OpsCenter,會提示你連接集群:

wKioL1ZZWNHh2YGFAAAv3Tlonww527.png

2、點擊ManageExisting Cluster,出現Add Cluster對話框。

wKiom1ZZWJigiLMHAABvwFIhh3Q247.png

3、在Add Cluster,輸入集群節點的Hostnames或IP地址,設置JMX和Native Transport端口號,點擊Save Cluster

OpsCenter連接到集群后,在Dashboard頂部會出現Fix連接。

4、點擊Fix連接開始安裝agents

wKioL1ZZWVfQWCHuAAAMp2G-dWA236.png

5、在Install Node Agent,點擊EnterCredentials

6、在Node SSH Credentials,輸入username和其他驗證信息,點擊Done。

7、在Install Node Agent對話框,點擊Install on all nodes。

8、如果提示,點擊Accept Fingerprint添加節點主機。

3.3.    結果

DataStax agents已經被安裝部署到集群節點上。

如果你不能夠通過OpsCenter UI安裝agents,請參考手動部署agents。

3.4.    手動部署agents

3.4.1.       前置條件

  • Cassandra或DataStax Enterprise集群正在運行。

  • OpsCenter已經安裝。

  • 集群節點JMX可用。

  • OpsCenter診斷tarball特性需要GNU1.16版本以上。CentOS/RHEL需要6以上。

  • SYSSTAT工具(用來手機I/O指標,yuminstall –y sysstat)

3.4.2.       步驟

  1. 下載DataStax agent tarball

$ curl -Lhttp://downloads.datastax.com/community/datastax-agent-version_number.tar.gz| tar xz

  1. 切入到agent目錄

$ cd datastax-agent-version_number

  1. address.yaml中設置stomp_interface為OpsCenter的IP地址(需要手動創建此文件)

$ echo "stomp_interface:reachable_opscenterd_ip" >> ./conf/address.yaml

  1. 如果在opscenterd.conf中開啟了SSL,則在address.yaml添加SSL。

$ echo "use_ssl: 1" >>./conf/address.yaml

  1. 開啟agent

$ bin/datastax-agent

使用-f選項可以運行在前台

3.5.    OpsCenter 參考

3.5.1.       OpsCenter 和DataStax agent端口號

端口號

描述

OpsCenter端口號

8888

OpsCenter web地址端口。Opscenterd監聽來自瀏覽器的HTTP端口號,在opscenterd.conf中配置。

50031

OpsCenter對於Job Tracker的HTTP代理端口。Opscenterd進程監聽瀏覽器查看Hadoop Job Tracker頁面的HTTP端口號,在opscenterd.conf中配置(只支持DataStax  Enterprise)

61620

OpsCenter監控端口號。Opscenterd進程監聽來自agent的TCP交互。在opscenterd.conf中配置。

DataStax agent端口號

7199

JMX監控端口號。每個agent節點會打開一個JMX連接

8012

Hadoop Job Tracker client端口號(只支持DataStax Enterprise)

8012

Hadoop Job Tracker website端口號(只支持DataStax  Enterprise)

8012

Hadoop Task Tracker website端口號(只支持DataStax Enterprise)

9042

native transport端口號,在cassandra.yaml中配置的native_transport_port

61621

DataStax agent端口號

22

SSH端口號。在opscenterd.conf中配置。

Solr和Demo applications端口號

8983

Solr端口號和Demo  applications端口號

LDAP服務端口號

389

非SSL LDAP和AD默認端口號。在opscenterd.conf中配置。

636

SSL LDAP和AD默認端口號。在opscenterd.conf中配置。

3.5.2.       安裝配置路徑

3.5.2.1.   非服務tarball安裝默認文件路徑

文件路徑與tarball安裝路徑相同。

安裝文件列表如下:

Directory

Location

/agent

Agent安裝文件

/bin

啟動和配置二進制命令

/content

Web應用文件

/conf

配置文件

/doc

License文件

/lib and /src

Library文件

/log

OpsCenter日志文件

/ssl

agent交互的SSL文件

3.5.3.       啟動,停止和重啟OpsCenter

非服務tarball步驟:

1、啟動opscenterd:

$ install_location/bin/opscenter ##使用-f可前台啟動

2、停止和重啟opscenterd:

  •  找出opscenterd進程ID(pid),kill掉進程

$ ps -ef | grep opscenter

$ sudo kill pid

  • 啟動opscenterd:

$ install_location/bin/opscenter ##使用-f可前台啟動

3.5.4.       啟動和重啟DataStax agents

非服務tarball安裝方式步驟:

1、啟動agent:

$ install_location/bin/datastax-agent##使用-f可前台啟動

2、停止和重啟agent:

  •  找出agent進程ID(pid),kill掉進程

$ ps -ef | grep datastax-agent

$ sudo kill pid

  • 啟動opscenterd:

$ install_location/bin/ datastax-agent ##使用-f可前台啟動

4.       配置

4.1.    配置事件告警

Activities展示了OpsCenterEvent日志頁面,包含事件和告警列表。下面的列表展示了事件日志級別:

  • DEBUG (0)

  • INFO (1)

  • WARN (2)

  • ERROR (3)

  • CRITICAL (4)

  • ALERT (5)

告警:

可選的,你可以配置OpsCenter發送告警信息對於選中的日志級別。這些告警可以通過郵箱、HTTP提供。默認告警不可用。

告警可以通過OpsCenter API或UI事件促發。比如,nodetool通過命令行執行move操作將不會促發告警,但是通過OpsCenter Nodes > List View > Other Actions > Move將會促發告警

告警包含的信息:

Field

Description

Example

api_source_ip

發送請求的原IP地址

67.169.50.240

target_node

STREAMING操作的目的地址

10.1.1.11

event_source

事件產生的組件

OpsCenter (i.e., restart, start)

user

事件產生的OpsCenter user

opscenter_user

time

事件時間

1311025650414527

action

事件類型

20

subject

郵件告警主題

[WARN] OpsCenter Event - Node reported as  being down: 127.0.0.1

message

事件描述

Garbage Collecting node 10.1.1.13

level

日志級別的數值

1

source_node

事件發生的原節點

10.1.1.13

level_str

事件日志級別

INFO

4.1.1.       開啟郵箱告警

為了啟動郵箱告警,需要編輯<config_location>/event-plugins/email.conf文件並提供可用的SMTPserver host和port信息。

4.1.1.1.   前置條件

確保你擁有可用的SMTP帳號可以收發告警。

4.1.1.2.   步驟

  1. 在OpsCenter主機上打開email.conf文件

  2. 設置enabled為1

  3. 提供有效的SMTP的主機、端口號、用戶名和密碼

  4. 提供有效的郵箱地址,to_addr和from_addr。to_addr值為接受告警帳號

  5.  可選的:設置發送告警級別。默認為監聽所有基本

  6. 可選的:自定義發送主題

  7. 保存<config_location>/event-plugins/email.conf。重啟OpsCenter。

為了發送告警給多個郵箱地址,創建不同的郵箱配置文件,比如email1.conf,email2.conf

4.1.1.3.   案例

[email]
# set to 1 to enable email
enabled=1
# levels can be comma delimited list of any of the following:
# DEBUG,INFO,WARN,ERROR,CRITICAL,ALERT
# If left empty, will listen for all levels
levels=WARN
smtp_host=smtp.gmail.com
smtp_port=465
smtp_user=mercury@gmail.com
smtp_pass=*********
smtp_use_ssl=1
smtp_use_tls=0
smtp_retries=1
smtp_timeout=5
to_addr=cassandra_admin@acme.com
from_addr=mercury@gmail.com
# Customizable subject for email.  The key specified in {}'s must map to the items provided in json map at the end of
# the emails. For example, some available keys are:
#     node, cluster, datetime, level_str, message, target_node, event_source, success, api_source_ip, user, source_node
# more advanced formatting options explained here: https://docs.python.org/2/library/string.html#formatspec
subject=[{level_str}] OpsCenter Event on {cluster} - {message}

4.2.    配置文件

配置能力,可以修改opscenterd.conf,cluster_name.conf和address.yaml配置文件。

         注意:OpsCenterconsole是最方便修改配置文件的方式。

  • opscenterd.conf:配置OpsCenter daemon屬性,路徑install_location/conf/opscenterd.conf

  • cluster_name.conf:配置OpsCenter集群監控屬性,路徑install_location/conf/clusters/cluster_name.conf

  • address.yaml:配置DataStaxagent屬性,路徑install_location/conf/address.yaml。

    大部分的屬性也可以在cluster_name.conf文件中的[agent_config]部分配置。

配置文件優先級:

Opscenter5.2之前版本cluster_name.conf配置優先於address.yaml。Opscenter5.2和之后版本,addresss.yaml優先於cluster_name.conf

4.2.1.       opscenterd.conf配置文件

注意修改文件屬性后,需要重啟Opscenter才能生效。

[webserver] port

OpsCenter webserver的HTTP連接端口。默認8888。

 

[webserver] interface

web server監聽clientconnections的interface

 

[webserver] log_path

HTTP交互的日志路徑,默認install_location/log/http.log

 

[logging] level

Opscenter日志級別,可用級別為:TRACE, DEBUG, INFO, WARN, ERROR。默認INFO

 

[logging] log_path

OpsCenter日志路徑,默認install_location/log/opscenterd.log。

5.       OpsCenter使用

5.1.    OpsCenter workspace介紹

5.1.1.       主菜單

wKioL1ZZlpnDOjdiAAAeot_2xb0801.png

從主菜單訪問OpsCenter以下功能:

  • New Cluster – 創建一個新的cluster或添加已經存在的cluster。

  • Alerts – 配置告警閥值。只有DataStax Enterprise可用

  • Settings – 訪問編輯ClusterConnections和User Roles:

  •  

    • Cluster Connections – 修改集群設置或移除集群

  •  

    • Users & Roles – 管理用戶基於角色認證

  • Help – OpsCenter資源信息

 

5.1.2.       導航菜單

wKiom1ZZlrDSnr0YAABNfMrPwGM500.png

  • Overview – 提供OpsCenter實例的集群概覽。

wKioL1ZZl0mRkfcPAACBjJksrxM642.png

  • Dashboard –查看OpsCenter集群信息,監控Cassandra集群性能指標。

wKiom1ZZlxug7NMrAAC-o9yYZwM511.png

  • Nodes – 從不同的角度查看集群(Ring or List View),執行集群節點的維護操作

wKioL1ZZl6PxbgeGAACgi-BdBoc182.png

  • Activities – 展示集群運行的任務,查看OpsCenter日志事件,比如在Eventlog中的OpsCenter啟動停止。查看Spark jobs狀態。查看那Hadoop Jobs狀態。

wKioL1ZZl8Hya9miAABOzW48XoQ096.png

  • Data – 管理keyspaces和tables

wKiom1ZZl4LwRNKhAAA4q-TFfHE313.png

Services - DataStax Enterprise管理服務

 

5.2.    節點監控和管理

 

5.2.1.      Ring View

Ring View展示了集群節點作為ring的節點,可以從此診斷節點健康,數據分布等。點擊cluster > Nodes> Ring,訪問Ring View

wKiom1ZZl-HTOer2AADGzK_0AwY741.png

Ring view解釋:

  • 健康概覽。監控圖標從左到右:Normal,Medium,High load,節點down

  • 顏色表示節點健康狀態,由系統負載決定。0–0.999為Normal (green),1–5 Medium (yellow),5+ High (red),down(gray)

節點詳情:

鼠標懸浮在節點上,將會展示節點詳情。詳情是實時更新的。

wKioL1ZZmHLwzIVlAABJoh9QD6Q269.png

點擊節點,將會展示節點詳情的對話框,展示更多的信息。使用Actions菜單可以在節點上運行多種操作。

wKiom1ZZmCzBUFg4AAD-lmmJV-A088.png

5.2.2.       List View

List View是RingView另一種展示。List View提供了當查看數據時,更快的訪問和更多的靈活性。所有數據都是實時更新的。

點擊cluster > Nodes > Listtab,訪問List View

wKioL1ZZmK2iE9WvAADToYvyeuQ868.png

查看節點詳情:

點擊節點,將會展示節點詳情的對話框,展示更多的信息。使用Actions菜單可以在節點上運行多種操作。

wKiom1ZZmCzBUFg4AAD-lmmJV-A088.png

5.2.3.       節點管理操作

5.2.3.1.   管理單個節點

從List View或Ring View點擊節點,從Actions菜單中選擇action

wKioL1ZZmN3g0Bd9AAA6Pv6UCVo902.png

5.2.3.2.   操作詳情

1、View Metrics

可以選擇指標,生成監控圖形

2、Configure

可以配置修改選中節點的cassandra.yaml文件

3、Start/Stop

啟動或停止Cassandra進程。

4、Restart

重啟Cassandra進程

5、Cleanup

移除節點的rows

6、Compact

執行壓縮操作,在大部分Cassandra集群不建議操作。

7、Flush

將內存中的數據(memtables)flush到磁盤(SSTables)

8、Repair

修復副本數據的不一致性。

9、Perform GC

強制JVM執行GC操作

10、Drain

使當前寫操作存儲在memtables中的數據flush到SSTables,並使此節點變為只讀。節點將不再接受新的寫入操作。Drain一般用於升級節點。

5.3.    管理keyspaces和tables

5.3.1.       管理keyspaces

步驟:

1、點擊左邊導航窗口中的Data。展示Keyspaces列表

wKioL1ZZmVXTJ6dtAADDEwwO2Ew538.png

2、選擇Keyspaces列表中的一個keyspace

wKiom1ZZmRKzVwIFAADmiqWK0oA753.png

3、在keyspace settings中,點擊Edit

wKiom1ZZmXvwVRwOAABmAk0Tv7A890.png

4、點擊Delete Keyspace,刪除keyspace

5.3.2.       管理tables

步驟:

  1. 點擊左邊導航窗口中的Data。展示Keyspaces列表

  2. 選中tables列表中的table,將會展示table的CQL statement

wKioL1ZZmgSAcRq5AAC7dTOmu1A544.png

3、其他操作:

  •  Delete:從keyspace中刪除此表

  •  View Metrics:展示table的指標

  •  Truncate:刪除此表的所有數據

5.4.    集群管理

5.4.1.       刪除集群

步驟:

  1. 從主菜單上,點擊Settings >Cluster Connections

wKiom1ZZmjbg38lhAACHn1zgGTI157.png

2、點擊Delete Cluster

5.4.2.       重啟集群

步驟:

  1. 點擊ClusterActions菜單中的Restart

wKioL1ZZmtHi8rd1AABWeRvl9fs760.png

2、設置每個節點重啟后等待時間。默認60s

3、可選的:選擇是否執行Drain在停止之前。

4、點擊Restart Cluster

5.4.3.       產生PDF報告

點擊Help >Report將產生集群監控PDF報告

wKioL1ZZmwLxR5gnAAAXMV7C5hk691.png

5.5.    性能指標

5.5.1.       使用性能指標

選擇Dashboard查看指標類型:

  • 集群性能指標

  • Task指標

  • Table指標

 

5.5.1.1.      創建和編輯性能圖

圖標可以在一個單元中包含多個指標。比如,一個圖標可以包含CPU和磁盤的利用率,讀寫請求和系統負載。

可以展示告警,集群健康和存儲容量。

步驟:

1、點擊Dashboard

2、點擊Add Graph

3、在Add Metric對話框,選擇指標

wKioL1ZZm1DS2czXAACWocsrAn8030.png

4、選擇監控的節點

5、可選的:點擊table,選擇特定的表

6、點擊Add Metric

7、點擊Save Graph展示指定的指標圖表

8、點擊圖標右上角的title,點擊Edit Graph可以編輯圖表

wKiom1ZZm3SDOlMxAACSl8L0070613.png

9、點擊Add Widget可以開啟和關閉Alerts, Cluster Health和Storage Capacity

wKiom1ZZm6iBJZfFAAAh8_Fst54857.png

5.5.1.2.   分組設置性能指標

步驟:

1、點擊Dashboard

wKioL1ZZnCvjHrMZAAAidNA9zf8106.png

2、點擊Clone可以克隆指標圖表

3、點擊Make Default,設置為默認

4、點擊Rename,可以重命名

5、點擊Delete,可以刪除

5.5.1.3.   導出導出dashboard

Dashboard導出導入為JSON文件

編輯opscenterd.conf,重啟opscenterd

[labs]

enable_dashboard_preset_import_export = True

步驟:

1、點擊Dashboard,點擊Export

wKioL1ZZnJvy408vAABQcMQbbjk575.png

2、點擊Import連接

wKiom1ZZnFaC3M0LAACNOoKpIzw726.png

5.5.2.       集群性能指標

CassandraJVM memory usage

Cassandra 進程使用Java heapmemory的平均值

 

WriteRequests

在coordinator節點上每秒的寫請求數,類似與client寫請求

 

WriteRequest Latency

Client寫響應平均時長(以毫秒為單位)。依賴於consistencylevel和replication factor,也包含了寫replicas的網絡延遲

 

Read Requests

在coordinator節點上每秒的讀請求數,類似與client讀請求

 

ReadRequest Latency

Client讀響應平均時長(以毫秒為單位)。read latency受到硬盤,網絡和應用程序讀的方式等影響。比如,使用二級索引,讀請求數據大小,client需要的consistency level都將影響read latency。I/O的爭用也會增加read latency。當SSTables有很多碎片,compaction跟不上寫負載則讀也會變慢。

 

JVMCMS Collection Count

JVM每秒並發標記-清除(CMS)垃圾的數量。

 

JVMCMS Collection Time

CMS垃圾收集時間(ms/sec)

 

JVMParNew Collection Count

JVM每秒並行執行的新一代垃圾收集的數量

 

JVMParNew Collection Time

ParNew垃圾收集時間(ms/sec)

 

DataSize

Cassandra存儲數據的大小。建議不超過磁盤的70%,留一些空間維護compaction和repair操作。

 

Totalbytes compacted

SSTable每秒數據壓縮的字節數

 

Totalcompactions

每秒壓縮的數量

 

5.5.3.       Pending任務指標

Pending tasks常常是由缺少集群資源引起,比如磁盤帶寬,網絡帶寬和內存。

5.5.3.1.   Pending task metrics forwrites(寫等待任務指標)

FlushesPending

Flush進程flush memtables到SSTables。這個指標展示了flushmemtables隊列的數量。最優數量為0(或較少數量)。值大於0表示有I/O競爭,降低了磁盤性能

 

Repl.(Replicate) on Write TasksPending (復制等待任務指標)

當插入或修改一行時,此行將會復制到其他節點。調用的是ReplicateOnWriteStage。這個指標跟蹤了寫進程階段。在一個低或適中的寫負載時,你應該看到0 pending replicate在寫任務上(或比較低的數字)。持續的高值表示需要檢查下磁盤I/O或網絡連接問題

 

5.5.3.2.   Pending task metrics forreads(讀等待任務指標)

ReadRequests Pending

到達集群等待處理的讀請求的數量。在一個低或適中的寫負載時,你應該看到0 pending read在寫任務上(或比較低的數字)。持續的高值表示需要檢查下磁盤I/O或網絡連接問題。Pending reads也可能表示應用設計沒有以有效的方式來訪問數據

 

ReadRepair Tasks Pending

讀修復操作隊列,等待系統資源的數量。最優數量為0(或比較低的數字)。值大於0表示讀修復操作與其他操作存在I/O競爭。對於表來說,降低此table參數read_repair_chance,你需要容忍一定程度的舊數據。

 

CompactionsPending

Compactions隊列的數量,等待系統資源。最優數量為0(或比較低的數字)。值大於0表示讀操作與compaction操作競爭I/O連接,表示讀性能下降。這種情況常常是由於執行頻繁的small writes和持久的reads。如果一個節點或集群展示了pending compactions,表示你可能需要增大I/O能力,通過添加節點到集群。你也可以減少I/O連接,通過減少插入/更新請求(比如批量寫入)。或則減少SSTables創建的數量,通過增大memtable大小,flush頻率。

 

5.5.3.3.   Pending task metrics forcluster operations(集群操作等待任務指標)

Manualrepair tasks pending

Repair操作數量。Repair是一個資源敏感操作,需要執行:比較副本間的數據,發送改變的row到副本來保證數據的一致性,刪除過期的tombstones,重建索引和bloom filters。跟蹤這個指標的狀態可以幫助你確定repaire操作的過程。它常常不會出現很大的值。

 

Gossiptasks pending

Cassandra使用gossip協議來發現其他節點的位置和狀態信息。每個節點每秒發送一次gossip,與其他節點交換狀態信息。Gossip tasks pending表示gossip messages等待發送或接受的數量。最優數量為0(或比較低的數字)。值大於0表示網絡可能有問題。

 

Hintedhandoff pending

當一個節點offline,其他節點在節點不可用期間將會保存rows更新的提示。當節點重新online,它對應的副本將會修復。hinted handoff pending指標表示等待發送給failed節點hints的數量。查看這個指標可以確定failed節點數據是否恢復。Hinted handoff是Cassandra可選的功能。Hints可以配置保存周期(默認1小時)。

 

Miscellaneoustasks pending

系統修改schema后的等待任務數量。Schema修改需要傳播給所有的節點,所以這個指標能夠表示schema 不一致的錯誤。

5.5.4.       Table性能指標

TBL:Local Writes

表的寫負載。指標包含所有的寫請求到此table,包含來自其他節點的寫請求。

 

TBL:Local Write Latency

成功寫入表后的響應事件,單位毫秒。writelatency受到硬盤,網絡和寫入性質影響(比如consistency levels)

 

TBL:Write Latency (Stacked)

寫數據的響應事件,包含min,median, max, 90%和99%

 

TBL:Local Reads

讀負載

 

TBL:Local Read Latency

成功讀取數據后的響應事件

 

ReadLatency (Stacked)

讀數據的響應事件,包含min, median, max, 90%和99%

 

TBL:Live Disk Used

存活的SSTables使用的磁盤空間,不包含過時的SSTables

 

TBL:Total Disk Used

SSTables使用的磁盤空間,包含過時的SSTables

 

TBL:SSTable Count

SSTables當前數量

 

TBL:SSTables per Read (Stacked)

讀取多少SSTables:包含min,median, max, 90%和99%

 

TBL:Cell Count

表在分區中存在多少個cells:包含min,median, max, 90%和99%

 

TBL:Partition Size

表的分區大小:包含min, median,max, 90%和99%

 

TBL:Pending Reads/Writes

表的讀寫等待數量。

 

TBL:Bloom Filter Space Used

bloomfilter文件在磁盤的大小。

 

TBL:Bloom Filter False Positives

bloom filter誤報的數量,比如bloomfilter表示row存在,但實際上不存在的數量

 

TBL:Bloom Filter False Positive Ratio

bloomfilter誤報的百分比

 

TBL:Bloom Filter Off Heap

bloomfilters使用的heap memory

 

TBL:Index Summary Off Heap

索引使用的heapmemory

 

TBL:Compression Metadata Off Heap

compressionmetadata使用的heap memory

 

TBL:Memtable Off Heap

表當前的memtable使用的heapmemory

 

TBL:Total Memtable Size

所有的memtables使用內存的空間

 

TBL:Key Cache Requests

在row key cache讀請求的數量

 

TBL:Key Cache Hits

在row keycache讀請求命中的數量

 

TBL:Key Cache Hit Rate

在row keycache讀請求命中的比率

 

TBL:Row Cache Requests

在row key cache讀請求的數量,這個指標只是展示配置的row caching(row caching默認不可用)

 

TBL:Row Cache Hits

在row key cache讀請求命中的數量,這個指標只是展示配置的row caching(row caching默認不可用)

 

TBL:Row Cache Hit Rate

在row key cache讀請求命中的比率,這個指標只是展示配置的row caching(row caching默認不可用)

 

TBL:SSTable Size

表當前SSTables當前大小

5.5.5.       操作系統性能指標

OS:Memory

展示系統內存的使用:cached,buffered和free

 

OS:CPU

系統和用戶進程使用CPU的時間

 

OS:Load

系統work數量

 

OS:Disk usage (GB)

Cassandra使用磁盤空間

 

OS:Disk Usage (percentage)

Cassandra使用磁盤空間的百分比

 

OS:Disk Throughput

讀寫操作的百分比,通過測量每秒的MB

 

OS:Disk Rates

磁盤對於讀寫操作的平均速度

 

OS:Disk Latency

磁盤查找消耗的平均時間,單位毫秒

 

OS:Disk Request Size

請求的平均大小

 

OS:Disk Queue Size

請求隊列的平均數量,對於磁盤延遲問題

 

OS:Disk Utilization

磁盤I/O消耗CPU時間的百分比

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM