配置Mysql Group Replication遇到的問題筆記

本文轉載自查看原文 2018-07-23 14:27 2631 Linux/ MySQL/ 數據庫

一

在配置第一台服務器

START GROUP_REPLICATION;

后出現以下問題：

ERROR 3092 (HY000): The server is not configured properly to be an active member of the group. Please see more details on error log.

發現，本機無法ping通，修改/etc/sysconfig/network-scripts/ifcfg-eth0（eth0為你上網用的網卡），設置好本機ip、子網掩碼、網關，之后重啟network就行

二、第二台服務器一直處於RECOVERING狀態

這個問題比較復雜，很有可能是因為出現一些錯誤情況導致服務器之間連接不成功，一般MySQL會嘗試連接10次，之后后起的服務器會處於ERROR狀態。

一旦一個實例進入ERROR狀態，該實例super_read_only選項被設置為ON。要離開ERROR 狀態，必須手動配置實例super_read_only=OFF。

情況1：

防火牆和selinux沒關，這是小問題，關掉就行。

情況2：

兩台服務器主機名相同，mysql無法通過DNS找到對應服務器。

解決方法：
在my.cnf文件中設置

report-host=192.168.50.22 #后面跟的ip是本機的ip

或者取消掉mysql通過DNS查找服務器的策略，當然，也可以修改hosts文件，方法網上可以找到的。當然，最好是設置report-host。
還有server_id每台服務器一定要不同。

情況3：

查看mysql日志，發現兩台服務器直接一直在嘗試連接，一直連接不上。嘗試10次之后，變成ERROR狀態。

VM Ware的鍋，概率不高。

然后我運氣不好，碰到了，折磨了我一個星期，網上根本找不到解決方法，最后換成VirtualBox就好了，實際生產環境應該不會有這么坑爹的問題，大概是VM Ware虛擬機網絡通信機制的問題，猜測可能還有防火牆，同事用VM Ware做成功了，大概是版本問題或者其他的，具體原因查不出來。

我后來在用一個純凈的基本沒有自配的服務的centos鏡像在VM Ware下裝機，連網卡都啟動不來后才猜出來的，然后毅然下了個VirtualBox，重新配，就沒問題了。

初步覺得可能是管理員權限的原因，VM Ware和Win 10都該背鍋。

情況4：

加載的sql查詢文件語法不兼容組復制，例如建表沒有主鍵，創建的帶返回值的函數沒有聲明DETERMINISTIC之類的，查MySQL日志大概能查出來。

三

如果用虛擬機模擬組復制，那么，最好不要直接克隆一台已經配置好的虛擬機，至少，不能克隆已經初始化了mysql的虛擬機，不然會造成兩台服務器的MEMBER_ID相同，導致兩台服務器無法找到對方。

四、自增量

如果在數據庫內使用到了自增的字段，最好在/etc/my.cnf中添加auto_increment_increment、auto_increment_offset兩個參數，防止發生事務沖突（MGR其實本身就有防止自增量事務沖突的能力，運用了GROUP_REPLICATION_AUTO_INCREMENT_INCREMENT這個參數，但如果不去手動設置，自增量的間隔會非常奇怪）。

auto_increment_increment為自增量的間隔，auto_increment_offset為自增量的初始位置。

從官網查到的文檔上，建議最好為：

auto_increment_increment=n（組內成員數）
auto_increment_offset=server_id(這里的server_id最好為1,2,3這樣的自增量,且每台都不同)

這樣肯定能解決事務沖突的問題，但是，這樣，為了讓自增量每次都是+1，必須得DB1插表，然后DB2，接着DB3...如果一直是DB1(或者任意一台組內的服務器)插表，會導致自增量每次是+n。如果有強迫症，會很難受...

網上也有這么做的：

auto_increment_increment=1
auto_increment_offset=2

這樣，我們做MGR的時候也試過，還試過auto_increment_offset等於其他大於1的值，基本上自增量每次都是+1，也沒有出現事務沖突，湊合着是可以用的，但邏輯上有點奇怪，不知道會不會有隱藏的問題。

至於

auto_increment_increment=1
auto_increment_offset=1

這樣的做法，肯定是哪位老哥用官網上的做法寫的DB1示例后，被人各種無腦Ctrl+C、Ctrl+V之后的做法。

這樣會導致每次自增的間隔為7，不論在哪台服務器上。

至於為什么會這樣，貌似是GROUP_REPLICATION_AUTO_INCREMENT_INCREMENT這個參數默認是7，而MGR默認的規避自增量導致的事務沖突的方式中auto_increment_increment=GROUP_REPLICATION_AUTO_INCREMENT_INCREMENT。

這樣做，還不如用官方提出的設計。

現在，我們在公司里，用的是：

# auto_increment_increment=1
auto_increment_offset=9

這里auto_increment_increment參數被我們注釋掉了，在測試的時候基本也沒出問題，不知道到時候到生產環境會怎樣。

自增字段的大小依賴於group replication組中成員的多少。

auto_increment_offset值，最好是大於等於組內成員數，如果段的大小等於組內成員的數量，則所有的自增值都會被使用。

auto_increment_offset值小於組內成員數，我們有試過，不過不知道是我們測試的虛擬機數量太少，還是情況考慮的不周，暫時沒什么問題，不過以防萬一，還是不要這么操作。

關於組復制設置自增量間隔，推薦可以看：

WL#8445: Group Replication: Auto-increment configuration/handling

笨小孩的dba之路-MySQL group replication介紹

還有自行Google，至於百度就算了，沒什么用。

五、設置read_only

因為以默認的方式（不設置loose-group_replication_single_primary_mode=FALSE）啟動組復制時后起服務器沒用寫的權限，所以要在MySQL shell上輸入

set global read_only=0;

不過，最好在服務器ONLINE之后再執行，不然，同步會出現問題。

查看日志/var/log/mysqld.log，大量出現：

[ERROR] Plugin group_replication reported: 'Transaction cannot be executed while Group Replication is recovering. Try again when the server is ONLINE.'
[ERROR] Run function 'before_commit' in plugin 'group_replication' failed

當然這樣依然有概率能ONLINE，不過比較浪費時間，而且也有很大概率失敗。

所有生產環境最好不要在服務器RECOVERING時設置read_only=0。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 MySQL-group-replication 配置 mysql group replication 安裝&配置詳解 Mysql Group Replication 簡介及單主模式組復制配置【轉】 mysql group replication觀點及實踐 mysql group replication 主節點宕機恢復 MySQL 5.7 基於組復制(MySQL Group Replication) - 運維小結 Percona XtraDB Cluster vs Galera Cluster vs MySQL Group Replication mysql筆記--group by,limit用法 MySQL Replication 常用架構常見的MySQL Replication Error