DAOS 分布式異步對象存儲|數據平面


DAOS 通過兩個緊密集成的平面進行運轉。數據平面處理繁重的運輸操作,而控制平面負責進程編排和存儲管理,簡化數據平面的操作。

模塊接口

I/O 引擎支持一個模塊接口,該接口允許按需加載服務器端代碼。每個模塊實際上都是一個庫,由 I/O 引擎通過 dlopen 動態加載。模塊和 I/O 引擎之間的接口在 dss_module 數據結構中定義。

每個模塊應指定:

  • 模塊名
  • daos_module_id 中的模塊標識符
  • 特征位掩碼
  • 一個模塊初始化和銷毀函數

此外,模塊還可以選擇配置:

  • 在整個堆棧啟動並運行后調用的配置和清理函數
  • CART RPC 處理程序
  • dRPC 處理程序

線程模型與 Argobot 集成

I/O 引擎是一個多線程進程,使用 Argobot 進行非阻塞處理。

默認情況下,每個 Target 都會創建一個 main xstream 和 no offload xstreams。offload xstream 的實際數量可以通過 daos_engine 命令行參數進行配置。此外,還創建了一個額外的 xstream 來處理傳入的元數據請求。每個 xstream 都綁定到一個特定的 CPU 核心。main xstream 接收來自客戶端和其他服務器的 Target 傳入請求。一個特定的 ULT (User Level Thread) 會在網絡和 NVMe I/O 操作方面提供幫助。

Thread-local Storage (TLS)

每個 xstream 分配的私有存儲可以通過 dss_tls_get() 函數進行訪問。

注冊時,每個模塊可以指定一個模塊密鑰,該密鑰的數據結構大小將由 TLS 中的每個 xstream 進行分配。

dss_module_key_get() 函數的作用是:返回特定注冊模塊密鑰的數據結構。

Incast Variable 集成

DAOS 使用 IV (incast variable) 在單個 IV 命名空間(組織結構為樹)下的服務器之間共享值和狀態。樹的根節點稱為 IV leader,服務器可以是葉子節點也可以是非葉子節點。

每個服務器都維護自己的 IV 緩存。在獲取過程中,如果本地緩存不能完成請求,它會將請求轉發給其父緩存,直到到達根緩存 (IV leader)。對於更新操作,服務器首先更新它的本地緩存,然后轉發到它的父緩存,直到到達根緩存,然后將更改傳播到其他的服務器。

IV 命名空間是屬於每個 Pool 的,在 Pool 連接期間創建,在 Pool 斷開連接期間銷毀。

要使用 IV,每個用戶需要在 IV 命名空間下注冊自己以獲得標識符,然后用戶將使用這個 ID 來獲取或更新自己在 IV 命名空間下的 IV 值。

dRPC 服務器

I/O 引擎包括一個 dRPC 服務器,它監聽給定 Unix Domain Socket 上的活動。

有關 dRPC 的基礎知識以及 Go 和 C 中的底層 API 的更多詳細信息,請參閱 dRPC Documentation

dRPC 服務器定期輪詢傳入的客戶端連接和請求。它可以通過 struct drpc_progress_context 對象同時處理多個客戶端連接,該對象管理監聽 Socket 的 struct drpc 對象以及任何活動的客戶端連接。

服務器在 xstream 0 自己的 ULT (User Level Thread) 中循環運行。dRPC Socket 已設置為非阻塞的,並且使用無超時輪詢。這允許服務器在 ULT 中運行,而不是在自己的 xstream 中運行,預計該通道的流量相對較低。

dRPC 進程

drpc_progress 表示 dRPC 服務器循環的一次迭代。其工作流程如下:

  1. 在監聽 Socket 和任何打開的客戶端連接上同時進行超時輪詢。
  2. 如果在客戶端連接上看到任何活動:
    1. 如果數據已輸入:調用 drpc_recv 處理輸入的數據。
    2. 如果客戶端已斷開連接或連接被破壞:釋放 struct drpc 對象並將其從 drpc_progress_context 中刪除。
  3. 如果在監聽器上發現任何活動:
    1. 如果有新的連接進入:調用 drpc_accept 並將新的 struct drpc 對象添加到 drpc_progress_context 中的客戶端連接列表中。
    2. 如果有錯誤:將 -DER_MISC 返回給調用者。I/O 引擎中會記錄該錯誤,但不會中斷 dRPC 服務器循環。在監聽器上獲取到錯誤是意外情況。
  4. 如果沒有看到任何活動,則將 -DER_TIMEDOUT 返回給調用者。這純粹是為了調試目的,實際上,I/O 引擎會忽略此錯誤代碼,因為缺少活動實際上並不是一種錯誤。

dRPC 處理程序注冊

單個 DAOS 模塊可以通過注冊一個或多個 dRPC 模塊 ID 的處理函數來實現對 dRPC 消息的處理。

注冊處理程序很簡單。在 dss_server_module 的字段 sm_drpc_handlers 中,靜態分配一個 struct dss_drpc_handler數組,該數組的最后一項為零,以指示列表的結尾。將字段設置為 NULL 表示沒有要注冊的處理程序。當 I/O 引擎加載 DAOS 模塊時,它將自動注冊所有 dRPC 處理程序。

注意:

  • dRPC 模塊 ID 與 DAOS 模塊 ID 不同。
  • 這是因為給定的 DAOS 模塊可能需要注冊多個 dRPC 模塊 ID,具體數量取決於 DAOS 模塊所涵蓋的功能。
  • dRPC 模塊 ID 必須是系統范圍內唯一的,並且列在一個中心頭文件 `src/include/daos/drpc_modules.h 中。

dRPC 服務器使用函數 drpc_hdlr_process_msg 來處理傳入的消息。此函數檢查傳入消息的模塊 ID,搜索處理程序。

  • 如果找到處理程序,則執行該處理程序,並返回 Drpc_Response
  • 如果找不到,它將生成自己的 Drpc_Response,指示模塊 ID 未注冊。

相關信息

GitHub: https://github.com/storagezhang

Emai: debugzhang@163.com

華為雲社區: https://bbs.huaweicloud.com/blogs/255571

DAOS: https://github.com/daos-stack/daos

本文翻譯自 https://github.com/daos-stack/daos/blob/master/src/control/README.md


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM