配置Mysql Group Replication遇到的問題筆記


在配置第一台服務器

START GROUP_REPLICATION;

后出現以下問題:

ERROR 3092 (HY000): The server is not configured properly to be an active member of the group. Please see more details on error log.

發現,本機無法ping通,修改/etc/sysconfig/network-scripts/ifcfg-eth0(eth0為你上網用的網卡),設置好本機ip、子網掩碼、網關,之后重啟network就行

二、第二台服務器一直處於RECOVERING狀態

這個問題比較復雜,很有可能是因為出現一些錯誤情況導致服務器之間連接不成功,一般MySQL會嘗試連接10次,之后后起的服務器會處於ERROR狀態。

一旦一個實例進入ERROR狀態,該實例super_read_only選項被設置為ON。要離開ERROR 狀態,必須手動配置實例super_read_only=OFF。

情況1:

防火牆和selinux沒關,這是小問題,關掉就行。

情況2:

兩台服務器主機名相同,mysql無法通過DNS找到對應服務器。

解決方法:
在my.cnf文件中設置

report-host=192.168.50.22 #后面跟的ip是本機的ip

或者取消掉mysql通過DNS查找服務器的策略,當然,也可以修改hosts文件,方法網上可以找到的。當然,最好是設置report-host。
還有server_id每台服務器一定要不同。

情況3:

查看mysql日志,發現兩台服務器直接一直在嘗試連接,一直連接不上。嘗試10次之后,變成ERROR狀態。

VM Ware的鍋,概率不高。

然后我運氣不好,碰到了,折磨了我一個星期,網上根本找不到解決方法,最后換成VirtualBox就好了,實際生產環境應該不會有這么坑爹的問題,大概是VM Ware虛擬機網絡通信機制的問題,猜測可能還有防火牆,同事用VM Ware做成功了,大概是版本問題或者其他的,具體原因查不出來。

我后來在用一個純凈的基本沒有自配的服務的centos鏡像在VM Ware下裝機,連網卡都啟動不來后才猜出來的,然后毅然下了個VirtualBox,重新配,就沒問題了。

初步覺得可能是管理員權限的原因,VM Ware和Win 10都該背鍋。

情況4:

加載的sql查詢文件語法不兼容組復制,例如建表沒有主鍵,創建的帶返回值的函數沒有聲明DETERMINISTIC之類的,查MySQL日志大概能查出來。

如果用虛擬機模擬組復制,那么,最好不要直接克隆一台已經配置好的虛擬機,至少,不能克隆已經初始化了mysql的虛擬機,不然會造成兩台服務器的MEMBER_ID相同,導致兩台服務器無法找到對方。

四、自增量

如果在數據庫內使用到了自增的字段,最好在/etc/my.cnf中添加auto_increment_increment、auto_increment_offset兩個參數,防止發生事務沖突(MGR其實本身就有防止自增量事務沖突的能力,運用了GROUP_REPLICATION_AUTO_INCREMENT_INCREMENT這個參數,但如果不去手動設置,自增量的間隔會非常奇怪)。

auto_increment_increment為自增量的間隔,auto_increment_offset為自增量的初始位置。

從官網查到的文檔上,建議最好為:

auto_increment_increment=n(組內成員數)
auto_increment_offset=server_id(這里的server_id最好為1,2,3這樣的自增量,且每台都不同)

這樣肯定能解決事務沖突的問題,但是,這樣,為了讓自增量每次都是+1,必須得DB1插表,然后DB2,接着DB3...如果一直是DB1(或者任意一台組內的服務器)插表,會導致自增量每次是+n。如果有強迫症,會很難受...

網上也有這么做的:

auto_increment_increment=1
auto_increment_offset=2

這樣,我們做MGR的時候也試過,還試過auto_increment_offset等於其他大於1的值,基本上自增量每次都是+1,也沒有出現事務沖突,湊合着是可以用的,但邏輯上有點奇怪,不知道會不會有隱藏的問題。

至於

auto_increment_increment=1
auto_increment_offset=1

這樣的做法,肯定是哪位老哥用官網上的做法寫的DB1示例后,被人各種無腦Ctrl+C、Ctrl+V之后的做法。

這樣會導致每次自增的間隔為7,不論在哪台服務器上。

至於為什么會這樣,貌似是GROUP_REPLICATION_AUTO_INCREMENT_INCREMENT這個參數默認是7,而MGR默認的規避自增量導致的事務沖突的方式中auto_increment_increment=GROUP_REPLICATION_AUTO_INCREMENT_INCREMENT。

這樣做,還不如用官方提出的設計。

現在,我們在公司里,用的是:

# auto_increment_increment=1
auto_increment_offset=9

這里auto_increment_increment參數被我們注釋掉了,在測試的時候基本也沒出問題,不知道到時候到生產環境會怎樣。

自增字段的大小依賴於group replication組中成員的多少。

auto_increment_offset值,最好是大於等於組內成員數,如果段的大小等於組內成員的數量,則所有的自增值都會被使用。

auto_increment_offset值小於組內成員數,我們有試過,不過不知道是我們測試的虛擬機數量太少,還是情況考慮的不周,暫時沒什么問題,不過以防萬一,還是不要這么操作。

關於組復制設置自增量間隔,推薦可以看:

WL#8445: Group Replication: Auto-increment configuration/handling

笨小孩的dba之路-MySQL group replication介紹

還有自行Google,至於百度就算了,沒什么用。

五、設置read_only

因為以默認的方式(不設置loose-group_replication_single_primary_mode=FALSE)啟動組復制時后起服務器沒用寫的權限,所以要在MySQL shell上輸入

set global read_only=0;

不過,最好在服務器ONLINE之后再執行,不然,同步會出現問題。

查看日志/var/log/mysqld.log,大量出現:

[ERROR] Plugin group_replication reported: 'Transaction cannot be executed while Group Replication is recovering. Try again when the server is ONLINE.'
[ERROR] Run function 'before_commit' in plugin 'group_replication' failed

當然這樣依然有概率能ONLINE,不過比較浪費時間,而且也有很大概率失敗。

所有生產環境最好不要在服務器RECOVERING時設置read_only=0。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM