(一)分布式數據管理之痛點
為了確保微服務之間松耦合,每個服務都有自己的數據庫, 有的是關系型數據庫(SQL),有的是非關系型數據庫(NoSQL)。開發企業事務往往牽涉到多個服務,要想做到多個服務數據的一致性並非易事,同樣,在多個服務之間進行數據查詢也充滿挑戰。我們以一個在線 B2B 商店為例,客戶服務包括了客戶的各種信息,例如可用信用等。管理訂單,提供訂單服務,則需要驗證某個新訂單與客戶的信用限制沒有沖突。在單體應用中,訂單服務只需要使用傳統事務交易就可以一次性檢查可用信用和創建訂單。相反微服務架構下,訂單和客戶表分別是相應服務的私有表,如下圖所示:
訂單服務不能直接訪問客戶表,只能通過客戶服務發布的 API 來訪問或者使用分布式事務, 也就是眾所周知的兩階段提交 (2PC)來訪問客戶表,2PC 意義圖如下所示:
這里存在兩個挑戰:
- 第一個挑戰是 2PC 除要求數據庫本身支持外,還要求服務的數據庫類型需要保持一致。但是現在的微服務架構中,每個服務的數據庫類型可能是不一樣的,有的可能是 MySQL 數據庫,有的也可能是 NoSQL 數據庫;
- 第二個挑戰是如何實現從多個服務中查詢數據。假設應用程序需要顯示一個客戶和他最近的訂單。如果訂單服務提供用於檢索客戶訂單的 API,那么應用程序端可以通過 JOIN 方式來檢索此數據,即應用程序首選從客戶服務檢索客戶,並從訂單服務檢索客戶的訂單。然而,如果訂單服務僅支持通過其主鍵查找訂單(也許它使用僅支持基於主鍵的檢索的 NoSQL 數據庫), 在這種情況下,就沒有方法來檢索查詢所需的數據。
為解決這兩大痛點,就需要我們使用到分步式數據管理了。
(二)分布式數據管理之舉措
在介紹分布式數據管理(CRUD)解決方案之前,有必要介紹下 CAP 原理和最終一致性相關概念。
(三)CAP 原理(CAP Theorem)
在足球比賽里,一個球員在一場比賽中進三個球,稱之為帽子戲法(Hat-trick)。在分布式數據系統中,也有一個帽子原理(CAP Theorem),不過此帽子非彼帽子。CAP 原理中,有三個要素:
- 一致性(C onsistency)
- 可用性(A vailability)
- 分區容忍性(P artition tolerance)
CAP 原理指的是,這三個要素最多只能同時實現兩點,不可能三者兼顧。
因此在進行分布式架構設計時,必須做出取舍。而對於分布式數據系統,分區容忍性是基本要求 ,否則就失去了價值,因此設計分布式數據系統,就是在一致性和可用性之間取一個平衡。
對於大多數 WEB 應用,其實並不需要強一致性,因此犧牲一致性而換取高可用性,是目前多數分布式數據庫產品的方向。
當然,犧牲一致性,並不是完全不管數據的一致性,否則數據是混亂的,那么系統可用性再高分布式再好也沒有了價值。
犧牲一致性,只是不再要求關系型數 據庫中的強一致性,而是只要系統能達到最終一致性即可,考慮到客戶體驗,這個最終一致的時間窗口,要盡可能的對用戶透明,也就是需要保障“用戶感知到的一致性”。
通常是通過數據的多份異步復制來實現系統的高可用和數據的最終一致性的,“用戶感知到的一致性”的時間窗口則 取決於數據復制到一致狀態的時間。
(四)最終一致性(eventually consistent)
對於一致性,可以分為從客戶端和服務端兩個不同的視角。
從客戶端來看,一致性主要指的是多並發訪問時更新過的數據如何獲取的問題。
從服務端來看,則是更新如何復制分布到整個系統,以保證數據最終一致。
一致性是因為有並發讀寫才有的問題,因此在理解一致性的問題時,一定要注意結合考慮並發讀寫的場景。
從客戶端角度,多進程並發訪問時,更新過的數據在不同進程如何獲取的不同策略,決定了不同的一致性。
對於關系型數據庫,要求更新過的數據能被后續的 訪問都能看到,這是強一致性 ;如果能容忍后續的部分或者全部訪問不到,則是弱一致性 ; 如果經過一段時間后要求能訪問到更新后的數據,則是最終一致性。
從服務端角度,如何盡快將更新后的數據分布到整個系統,降低達到最終一致性的時間窗口,是提高系統的可用度和用戶體驗非常重要的方面。
那么問題來了,如何實現數據的最終一致性呢?答案就在事件驅動架構。
(五)事件驅動架構簡介
Chris Richardson 作為微服務架構設計領域的權威,給出了分布式數據管理的最佳解決方案。
對於大多數應用而言,要實現微服務的分布式數據管理,需要采用事件驅動架構(event-driven architecture)。
在事件驅動架構中,當某件重要事情發生時,微服務會發布一個事件,例如更新一個業務實體。
當訂閱這些事件的微服務接收此事件時,就可以更新自己的業務實體,也可能會引發更多的事件發布,讓其他相關服務進行數據更新,最終實現分布式數據最終一致性。
可以使用事件來實現跨多服務的業務交易。交易一般由一系列步驟構成,每一步驟都由一個更新業務實體的微服務和發布激活下一步驟的事件構成。
事件驅動示例 1
下圖展現如何使用事件驅動方法,在創建訂單時檢查信用可用度,微服務之間通過消息代理(Messsage Broker)來交換事件。
- 訂單服務創建一個帶有 NEW 狀態的 Order (訂單),發布了一個“Order Created Event(創建訂單)”的事件。
- 客戶服務消費 Order Created Event 事件,為此訂單預留信用,發布“Credit Reserved Event(信用預留)”事件。
- 訂單服務消費 Credit Reserved Event,改變訂單的狀態為 OPEN。
事件驅動示例 2
下圖展現如何使用事件驅動方法,在創建訂單時觸發支付業務的數據更新,微服務之間通過消息代理(Messsage Broker)來交換事件。
- 訂單服務創建一個待支付的訂單,發布一個“創建訂單”的事件。
- 支付服務消費“創建訂單”事件,支付完成后發布一個“支付完成”事件。
- 訂單服務消費“支付完成”事件,訂單狀態更新為待出庫。
(六)事件驅動架構之分布式數據更新
上節通過示例概要介紹了通過事件驅動方式,實現了分布式數據最終一致性保證。縱觀微服務架構下的事件驅動業務處理邏輯,其核心要點在於,可靠的事件投遞和避免事件的重復消費。
可靠事件投遞有以下兩個特性:
- 每個服務原子性的完成業務操作和發布事件;
- 消息代理確保事件投遞至少一次(at least once);
而避免事件重復消費則要求消費事件的服務實現冪等性,比如支付服務不能因為重復收到事件而多次支付。
BTW:當前流行的消息隊列如Kafka等,都已經實現了事件的持久化和at least once的投遞模式,所以可靠事件投遞的第二條特性已經滿足,這里就不展開。接下來章節講重點講述如何實現可靠事件投遞的第一條特性和避免事件重復消費,即服務的業務操作和發布事件的原子性和避免消費者重復消費事件要求服務實現冪等性。
如何實現事件投遞操作原子性?
事件驅動架構會碰到數據庫更新和發布事件原子性問題。例如,訂單服務必須向 ORDER 表插入一行,然后發布 Order Created event,這兩個操作需要原子性。比如更新數據庫后,服務癱了(crashes)造成事件未能發布,系統變成不一致狀態。那么如何實現服務的業務操作和發布事件的原子性呢?
- 使用本地事務發布事件
獲得原子性的一個方法是將服務的業務操作和發布事件放在一個本地數據庫事務里,也就是說,需要在本地建立一個 EVENT 表,此表在存儲業務實體數據庫中起到消息列表功能。當應用發起一個(本地)數據庫交易,更新業務實體狀態時,會向 EVENT 表中插入一個事件,然后提交此次交易。另外一個獨立應用進程或者線程查詢此 EVENT 表,向消息代理發布事件,然后使用本地交易標志此事件為已發布,如下圖所示:
訂單服務向 ORDER 表插入一行,然后向 EVENT 表中插入 Order Created event,事件發布線程或者進程查詢 EVENT 表,請求未發布事件,發布他們,然后更新 EVENT 表標志此事件為已發布。
此方法也是優缺點都有。優點是可以確保事件發布不依賴於 2PC,應用發布業務層級事件而不需要推斷他們發生了什么;而缺點在於此方法由於開發人員必須牢記發布事件,因此有可能出現錯誤。
- 使用事件源
Event sourcing (事件源)通過使用以事件中心的數據存儲方式來保證業務實體的一致性。事件源保存了每個業務實體所有狀態變化的事件,而不是存儲實體當前的狀態。應用可以通過重放事件來重建實體現在的狀態。只要業務實體發生變化,新事件就會添加到事件表中。因為保存事件是單一操作,因此肯定是原子性的。
為了理解事件源工作方式,考慮以事件實體作為一個例子說明。傳統方式中,每個訂單映射為 ORDER 表中一行。但是對於事件源方式,訂單服務以事件狀態改變方式存儲一個訂單:創建的,已批准的,已發貨的,取消的;每個事件包括足夠信息來重建訂單的狀態。
事件源方法有很多優點:解決了事件驅動架構關鍵問題,使得業務實體更新和事件發布原子化,但是也存在缺點,因為是持久化事件而不是對象,導致數據查詢時,必須使用 Command Query Responsibility Segregation (CQRS) 來完成查詢業務,從開發角度看,存在一定挑戰。
如何避免事件重復消費?
要避免事件重復消費,需要消費事件的服務實現服務冪等,因為存在重試和錯誤補償機制,不可避免的在系統中存在重復收到消息的場景,服務冪等能提高數據的一致性。在編程中,一個冪等操作的特點是其任意多次執行所產生的影響均與一次執行的影響相同,因此需要開發人員在功能設計實現時,需要特別注意服務的冪等性。
(七)事件驅動架構之分布式數據查詢
微服務架構下,由於分布式數據庫的存在,導致在執行用戶業務數據查詢時,通常需要跨多個微服務數據庫進行數據查詢,也就是分布式數據查詢。那么問題來了,由於每個微服務的數據都是私有化的,只能通過各自的REST接口獲取,如果負責業務查詢的功能模塊,通過調用各個微服務的REST接口來分別獲取基礎數據,然后在內存中再進行業務數據拼裝后,再返回給用戶。該方法無論從程序設計或是查詢性能角度看,都不是一個很好的方法。那么如何解決微服務架構下的分布式數據查詢問題呢? 在給出解決方案之前,需要讀者首先了解下物化視圖和命令查詢職責分離等相關概念。
什么是物化視圖(merialized views)?
物化視圖是包括一個查詢結果的數據庫對像,它是遠程數據的的本地副本,或者用來生成基於數據表求和的匯總表。物化視圖存儲基於遠程表的數據,也可以稱為快照。這個基本上就說出了物化視圖的本質,它是一組查詢的結果,這樣勢必為將來再次需要這組數據時大大提高查詢性能。物化視圖有兩種刷新模式 ON DEMAND 和 ON COMMIT,用戶可根據實際情況進行設置。
物化視圖對於應用層是透明的,不需要有任何的改動,終端用戶甚至都感覺不到底層是用的物化視圖。總之,使用物化視圖的目的一個是提高查詢性能,另一個是由於物化視圖包含的數據是遠程數據庫的數據快照或拷貝,微服務可通過物化視圖和命令查詢職責分離(CQRS)技術(參見以下章節)實現分布式數據查詢。
什么是命令查詢職責分離(CQRS)?
在常用的單體應用架構中,通常都是通過數據訪問層來修改或者查詢數據,一般修改和查詢使用的是相同的實體。在一些業務邏輯簡單的系統中可能沒有什么問題,但是隨着系統邏輯變得復雜,用戶增多,這種設計就會出現一些性能問題;另外更重要的是,在微服務架構下,通常需要跨多個微服務數據庫來查詢數據,此時,我們可借助命令查詢職責分離(CQRS)來有效解決這些問題。
CQRS 使用分離的接口將數據查詢操作(Queries)和數據修改操作(Commands)分離開來,這也意味着在查詢和更新過程中使用的數據模型也是不一樣的。這樣讀和寫邏輯就隔離開來了。使用 CQRS 分離了讀寫職責之后,可以對數據進行讀寫分離操作來改進性能,同時提高可擴展性和安全。如下圖:
主數據庫處理 CUD,從庫處理 R,從庫的的結構可以和主庫的結構完全一樣,也可以不一樣,從庫主要用來進行只讀的查詢操作。在數量上從庫的個數也可以根據查詢的規模進行擴展,在業務邏輯上,也可以根據專題從主庫中划分出不同的從庫。從庫也可以實現成 ReportingDatabase,根據查詢的業務需求,從主庫中抽取一些必要的數據生成一系列查詢報表來存儲。
使用 ReportingDatabase 的一些優點通常可以使得查詢變得更加簡單高效:
- ReportingDatabase 的結構和數據表會針對常用的查詢請求進行設計。
- ReportingDatabase 數據庫通常會去正規化,存儲一些冗余而減少必要的 Join 等聯合查詢操作,使得查詢簡化和高效,一些在主數據庫中用不到的數據信息,在 ReportingDatabase 可以不用存儲。
- 可以對 ReportingDatabase 重構優化,而不用去改變操作數據庫。
- 對 ReportingDatabase 數據庫的查詢不會給操作數據庫帶來任何壓力。
- 可以針對不同的查詢請求建立不同的 ReportingDatabase 庫。
如何實現事件驅動架構下的數據查詢服務?
事件驅動不僅可以用於分布式數據一致性保證,還可以借助物化視圖和命令查詢職責分離技術,使用事件來維護不同微服務擁有數據預連接(pre-join)的物化視圖,從而實現微服務架構下的分布式數據查詢。維護物化視圖的服務訂閱了相關事件並在事件發生時更新物化視圖。例如,客戶訂單視圖更新服務(維護客戶訂單視圖)會訂閱由客戶服務和訂單服務發布的事件(您還可以使用事件來維護由多個微服務擁有的數據組成的物化視圖。
例如上圖中間的 “客戶訂單視圖更新”服務,主要負責客戶訂單視圖的更新。該服務訂閱了客戶服務和訂單服務發布的事件。當“客戶訂單視圖更新”服務收到了上圖左側的客戶或者訂單更新事件,則會觸發更新客戶訂單物化視圖數據集。這里可以使用文檔數據庫(例如 MongoDB )來實現客戶訂單視圖,為每個用戶存儲一個文檔。而上圖右側的客戶訂單視圖查詢服務負責響應對客戶以及最近訂單(通過查詢客戶訂單視圖數據集)的查詢。
總之,上圖所示業務邏輯,用到了事件驅動、物化視圖和命令查詢職責分離等技術,有效解決了微服務架構下分布式數據查詢的問題。
(八)事件驅動架構優缺點
事件驅動架構既有優點也有缺點,此架構可以實現跨多個服務的事務實現,且提供最終數據一致性,並且使得服務能夠自動維護查詢視圖;而缺點在於編程模式比傳統基於事務的交易模式更加復雜,必須實現補償事務以便從應用程序級故障中恢復,例如,如果信用檢查不成功則必須取消訂單;另外,應用必須應對不一致的數據,比如當應用讀取未更新的最終視圖時也會遇見數據不一致問題。另外一個缺點在於訂閱者必須檢測和忽略冗余事件,避免事件重復消費。
總結
在微服務架構中,每個微服務都有自己私有的數據集。不同微服務可能使用不同的SQL或者NoSQL數據庫。盡管數據庫架構有很強的優勢,但是也面對數據分布式管理的挑戰。第一個挑戰就是如何在多服務之間維護業務數據一致性;第二個挑戰是如何從多服務環境中獲取一致性數據。
最佳解決辦法是采用事件驅動架構。其中碰到的一個挑戰是如何原子性的更新狀態和發布事件。有幾種方法可以解決此問題,包括將數據庫視為消息隊列和事件源等。
從目前技術應用范圍和成熟度看,推薦使用第一種方式(本地事務發布事件),來實現事件投遞原子化,即可靠事件投遞。
重要提醒
數據一致性是微服務架構設計中唯恐避之不及卻又不得不考慮的話題。通過保證事件驅動實現最終數據的一致性,此方案的優劣,也不能簡單的一言而概之,而是應該根據場景定奪,適合的才是最好的。另外,我們在對微服務進行業務划分的時候就盡可能的避免“可能會產生一致性問題”的設計。如果這種設計過多,也許是時候考慮改改設計了。