如何遷移Alwayson AG


Windows cluster要求同一個cluster中的所有windows版本都是相同的,這樣就出現一個問題,當我們要將對windows進行升級時,(例如從windows 2008 R2升級到windows 2012)不得不搭建一套新的windows cluster。你可以選擇使用新的硬件搭建,或者將現有windows cluster中的節點一台一台的evict掉,重裝/升級系統后加入到新的windows cluster中。具體的cluster升級方案我就不在這里討論。馬上進入主題:

SQL Server AlwaysOn Availability Group (后文簡稱為AG) 的一個要求是:所有的replica都要求隸屬於同一個windows cluster。

所以當我們對windows cluster進行升級時,無法在新的windows cluster和現有的windows cluster之間建立AG。那么在遷移過程中會有一段時間內AG無法對外提供服務。

 

從數據庫的角度上說,我們需要做下面的事情

  1. 接下來停止應用並刪除cluster1中的Listener,確保沒有外界來接使用SQL SERVER.
  2. Backup database
  3. Backup tail log
  4. 將備份文件copy到新的服務器
  5. Restore 到各個服務器
  6. 然后重新建立AG
  7. 創建Listener
  8. 重啟應用

我們需要將數據庫備份並還原到新的primary replica和secondary replica。 相應的downtime時間就是1+2+3+4+5+6+7+8想要的時間。 或許你想到了在新舊cluster之間創建一個mirroring,但遺憾的是,創建了AG的數據庫是不再允許創建mirroring的.

 

那應當如何進行遷移呢?從SQL Server 2012 SP1 開始,允許在兩套不同的windows cluster之間創建AG。下面用一個例子說明一下

 

有一個三個節點的windows cluster, windows版本為Windows 2008 R2

Domain:liweiyin3.lab

Cluster name: cluster1

Server002

Server003

Server004

Listener name: Listener1

三個節點上裝有SQL Server 2012 SP1的standalone實例。均為默認實例。

之間建立了AG.拓撲圖如下:

 

 

現在創建一套兩個節點的windows 2012的windows cluster

Domain:liweiyin3.lab

Cluster name: cluster2

Server005

Server006

 

Datacenter 1

Server005

Server006

Win 2012

Win2012

Cluster2

 

兩個cluster中間創建AG:

  1. 對cluster1上的AG數據庫進行備份,包含full database backup和log backup
  2. 將第一步得到的文件在cluster2的節點上進行還原,指定為with norecovery.
  3. 接下來在cluster2的三個數據庫上執行下面的語句

    ALTER SERVER CONFIGURATION SET HADR CLUSTER CONTEXT='cluster1.liweiyin3.lab'

    這條語句執行完畢后,這台數據庫的cluster context就會切換為cluster1了。這個結果可以從下面的DMV中檢查到

    select cluster_name from sys.dm_hadr_cluster

 

     4.接下就可以在cluster1和cluster2之間建立AG。我們可以使用UI或者T-SQL語句。需要注意的是,請將cluster2中的至少一個SQL Server的同步模式設置為Synchronous commit,以保證遷移是沒有數據損失的。

 

這樣,我們就建立了一套既包含win 2008R2,也包含win 2012的AG環境了。並且也可以正常地向外界提供服務,整個過程不需要downtime.

 

但需要注意的是,這種情況下是不允許在兩個cluster之間進行failover的。相應的提示信息如下

An attempt to fail over or create an availability group failed. This operation is not supported when AlwaysOn Availability Groups is running under a remote Windows Server Failover Clustering (WSFC) cluster context. Under a remote cluster context, failing over or creating availability groups are not supported.

 

5.接下來停止應用並刪除cluster1中的Listener,確保沒有外界來接使用SQL SERVE

6.在Cluster1將AG進行offline操作

       ALTER AVAILABILITY GROUP agName offline

7.將cluster2中所有sql serverCLUSTER CONTEXT切換回來

      ALTER SERVER CONFIGURATION SET HADR CLUSTER CONTEXT=local

8.在cluster2中重新創建AG

9.在cluster2中創建新的listener

10.重啟應用

這樣所涉及的downtime就是5+6+7+8+9+10

 

和之前的解決方案相比,省去了backup,文件copyrestore的時間。其余的操作都是句操作,很大程度地減少了downtime

 

更多信息

===

遷移之前,Cluster2中的sql server不允許創建任何AG。

遷移之前需要授予cluster2中的sql server啟動賬號訪問cluster1注冊表的權限

在第六步“在Cluster1中將AG進行offline操作”之前在各個AG 數據庫中執行checkpoint,以前少cluster2中數據庫的recovery時間。

對於multiply subnet場景,則需要在各自的子網內創建新的cluster,然后搭建AG。

Change the HADR Cluster Context of Server Instance (SQL Server) http://msdn.microsoft.com/en-us/library/jj573601.aspx

 

-----------------------3/1/2017----------------

Distributed Availability Groups is a better choice :)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM