具體監控配置詳看這篇文章:https://www.cnblogs.com/sanduzxcvbnm/p/13094580.html
為了確保數據庫的穩定運行,通常會關注一下四個與性能和資源利用率相關的指標:查詢吞吐量、連接情況、緩沖池使用情況以及查詢執行性能等。
監控數據庫吞吐量
對於數據庫而言,最重要的工作就是實現對數據的增、刪、改、查。為了衡量數據庫服務器當前的吞吐量變化情況。在MySQL內部通過一個名為Questions的計數器,當客戶端發送一個查詢語句后,其值就會+1。可以通過以下MySQL指令查詢Questions等服務器狀態變量的值:
mysql> SHOW GLOBAL STATUS LIKE "Questions";
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| Questions | 1326 |
+---------------+-------+
1 row in set (0.00 sec)
MySQLD Exporter中返回的樣本數據中通過mysql_global_status_questions反映當前Questions計數器的大小:
# HELP mysql_global_status_questions Generic metric from SHOW GLOBAL STATUS.
# TYPE mysql_global_status_questions untyped
mysql_global_status_questions 1016
通過以下PromQL可以查看當前MySQL實例查詢速率的變化情況,查詢數量的突變往往暗示着可能發生了某些嚴重的問題,因此用於用戶應該關注並且設置響應的告警規則,以及時獲取該指標的變化情況:
rate(mysql_global_status_questions[2m])
一般還可以從監控讀操作和寫操作的執行情況進行判斷。通過MySQL全局狀態中的Com_select可以查詢到當前服務器執行查詢語句的總次數:相應的,也可以通過Com_insert、Com_update以及Com_delete的總量衡量當前服務器寫操作的總次數,例如,可以通過以下指令查詢當前MySQL實例insert語句的執行次數總量:
mysql> SHOW GLOBAL STATUS LIKE "Com_insert";
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| Com_insert | 0 |
+---------------+-------+
1 row in set (0.00 sec)
從MySQLD Exporter的/metrics返回的監控樣本中,可以通過global_status_commands_total獲取當前實例各類指令執行的次數:
# HELP mysql_global_status_commands_total Total number of executed MySQL commands.
# TYPE mysql_global_status_commands_total counter
mysql_global_status_commands_total{command="admin_commands"} 0
mysql_global_status_commands_total{command="alter_db"} 0
mysql_global_status_commands_total{command="alter_db_upgrade"} 0
mysql_global_status_commands_total{command="select"} 10
mysql_global_status_commands_total{command="insert"} 2
mysql_global_status_commands_total{command="update"} 2
mysql_global_status_commands_total{command="delete"} 1
用戶可以通過以下PromQL查看當前MySQL實例寫操作速率的變化情況:
sum(rate(mysql_global_status_commands_total{command=~"insert|update|delete"}[2m])) without (command)
連接情況
在MySQL中通過全局設置max_connections限制了當前服務器允許的最大客戶端連接數量。一旦可用連接數被用盡,新的客戶端連接都會被直接拒絕。 因此當監控MySQL運行狀態時,需要時刻關注MySQL服務器的連接情況。用戶可以通過以下指令查看當前MySQL服務的max_connections配置:
mysql> SHOW VARIABLES LIKE 'max_connections';
+-----------------+-------+
| Variable_name | Value |
+-----------------+-------+
| max_connections | 151 |
+-----------------+-------+
1 row in set (0.01 sec)
MySQL默認的最大鏈接數為151。臨時調整最大連接數,可以通過以下指令進行設置:
SET GLOBAL max_connections = 200;
如果想永久化設置,則需要通過修改MySQL配置文件my.cnf,添加以下內容:
max_connections = 200
通過Global Status中的Threads_connected、Aborted_connects、Connection_errors_max_connections以及Threads_running可以查看當前MySQL實例的連接情況。
例如,通過以下指令可以直接當前MySQL實例的連接數:
mysql> SHOW GLOBAL STATUS LIKE "Threads_connected";
+-------------------+-------+
| Variable_name | Value |
+-------------------+-------+
| Threads_connected | 1 |
+-------------------+-------+
1 row in set (0.00 sec)
當所有可用連接都被占用時,如果一個客戶端嘗試連接至MySQL,會出現“Too many connections(連接數過多)”錯誤,同時Connection_errors_max_connections的值也會增加。為了防止出現此類情況,你應該監控可用連接的數量,並確保其值保持在max_connections限制以內。同時如果Aborted_connects的數量不斷增加時,說明客戶端嘗試連接到MySQL都失敗了。此時可以通過Connection_errors_max_connections以及Connection_errors_internal分析連接失敗的問題原因。
下面列舉了與MySQL連接相關的監控指標:
- mysql_global_variables_max_connections: 允許的最大連接數;
- mysql_global_status_threads_connected: 當前開放的連接;
- mysql_global_status_threads_running:當前開放的連接;
- mysql_global_status_aborted_connects:當前開放的連接;
- mysql_global_status_connection_errors_total{error=”max_connections”}:由於超出最大連接數導致的錯誤;
- mysql_global_status_connection_errors_total{error=”internal”}:由於系統內部導致的錯誤;
通過PromQL查詢當前剩余的可用連接數:
mysql_global_variables_max_connections - mysql_global_status_threads_connected
使用PromQL查詢當前MySQL實例連接拒絕數:
mysql_global_status_aborted_connects
監控緩沖池使用情況
MySQL默認的存儲引擎InnoDB使用了一片稱為緩沖池的內存區域,用於緩存數據表以及索引的數據。 當緩沖池的資源使用超出限制后,可能會導致數據庫性能的下降,同時很多查詢命令會直接在磁盤中執行,導致磁盤I/O不斷攀升。 因此,應該關注MySQL緩沖池的資源使用情況,並且在合理的時間擴大緩沖池的大小可以優化數據庫的性能。
Innodb_buffer_pool_pages_total反映了當前緩沖池中的內存頁的總頁數。可以通過以下指令查看:
mysql> SHOW GLOBAL STATUS LIKE "Innodb_buffer_pool_pages_total";
+--------------------------------+-------+
| Variable_name | Value |
+--------------------------------+-------+
| Innodb_buffer_pool_pages_total | 8191 |
+--------------------------------+-------+
1 row in set (0.02 sec)
MySQLD Exporter通過以下指標返回緩沖池中各類內存頁的數量:
# HELP mysql_global_status_buffer_pool_pages Innodb buffer pool pages by state.
# TYPE mysql_global_status_buffer_pool_pages gauge
mysql_global_status_buffer_pool_pages{state="data"} 516
mysql_global_status_buffer_pool_pages{state="dirty"} 0
mysql_global_status_buffer_pool_pages{state="free"} 7675
mysql_global_status_buffer_pool_pages{state="misc"} 0
Innodb_buffer_pool_read_requests記錄了正常從緩沖池讀取數據的請求數量。可以通過以下指令查看:
mysql> SHOW GLOBAL STATUS LIKE "Innodb_buffer_pool_read_requests";
+----------------------------------+--------+
| Variable_name | Value |
+----------------------------------+--------+
| Innodb_buffer_pool_read_requests | 797023 |
+----------------------------------+--------+
1 row in set (0.00 sec)
MySQLD Exporter通過以下指標返回緩沖池中Innodb_buffer_pool_read_requests的值:
# HELP mysql_global_status_innodb_buffer_pool_read_requests Generic metric from SHOW GLOBAL STATUS.
# TYPE mysql_global_status_innodb_buffer_pool_read_requests untyped
mysql_global_status_innodb_buffer_pool_read_requests 736711
當緩沖池無法滿足時,MySQL只能從磁盤中讀取數據。Innodb_buffer_pool_reads即記錄了從磁盤讀取數據的請求數量。通常來說從內存中讀取數據的速度要比從磁盤中讀取快很多,因此,如果Innodb_buffer_pool_reads的值開始增加,可能意味着數據庫的性能有問題。 可以通過以下只能查看Innodb_buffer_pool_reads的數量
mysql> SHOW GLOBAL STATUS LIKE "Innodb_buffer_pool_reads";
+--------------------------+-------+
| Variable_name | Value |
+--------------------------+-------+
| Innodb_buffer_pool_reads | 443 |
+--------------------------+-------+
1 row in set (0.00 sec)
在MySQLD Exporter中可以通過以下指標查看Innodb_buffer_pool_reads的數量。
# HELP mysql_global_status_innodb_buffer_pool_reads Generic metric from SHOW GLOBAL STATUS.
# TYPE mysql_global_status_innodb_buffer_pool_reads untyped
mysql_global_status_innodb_buffer_pool_reads 443
通過以上監控指標,以及實際監控的場景,我們可以利用PromQL快速建立多個監控項。
通過以下PromQL可以得到各個MySQL實例的緩沖池利用率。一般來說還需要結合Innodb_buffer_pool_reads的增長率情況來結合判斷緩沖池大小是否合理:
(sum(mysql_global_status_buffer_pool_pages) by (instance) - sum(mysql_global_status_buffer_pool_pages{state="free"}) by (instance)) / sum(mysql_global_status_buffer_pool_pages) by (instance)
也可以通過以下PromQL計算2分鍾內磁盤讀取請求次數的增長率的變化情況:
rate(mysql_global_status_innodb_buffer_pool_reads[2m])
查詢性能
MySQL還提供了一個Slow_queries的計數器,當查詢的執行時間超過long_query_time的值后,計數器就會+1,其默認值為10秒,可以通過以下指令在MySQL中查詢當前long_query_time的設置:
mysql> SHOW VARIABLES LIKE 'long_query_time';
+-----------------+-----------+
| Variable_name | Value |
+-----------------+-----------+
| long_query_time | 10.000000 |
+-----------------+-----------+
1 row in set (0.00 sec)
通過以下指令可以查看當前MySQL實例中Slow_queries的數量:
mysql> SHOW GLOBAL STATUS LIKE "Slow_queries";
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| Slow_queries | 0 |
+---------------+-------+
1 row in set (0.00 sec)
MySQLD Exporter返回的樣本數據中,通過以下指標展示當前的Slow_queries的值:
# HELP mysql_global_status_slow_queries Generic metric from SHOW GLOBAL STATUS.
# TYPE mysql_global_status_slow_queries untyped
mysql_global_status_slow_queries 0
通過監控Slow_queries的增長率,可以反映出當前MySQL服務器的性能狀態,可以通過以下PromQL查詢Slow_queries的增長情況:
rate(mysql_global_status_slow_queries[2m])
在MySQL中還可以通過安裝response time插件,從而支持記錄查詢時間區間的統計信息。啟動該功能后MySQLD Exporter也會自動獲取到相關數據,從而可以細化MySQL查詢響應時間的分布情況。