區塊鏈與聯邦學習綜述


區塊鏈與聯邦學習綜述

本期分享的論文是由Dinh C. Nguyen等人在2021年發表在IEEE Internet of Things Journal的文章《Federated Learning Meets Blockchain in Edge Computing Opportunities and Challenges》。

一、摘要

移動邊緣計算(Mobile edge computing,MEC)用來處理來自無處不在的移動設備的大量數據,以便在人工智能(AI)的幫助下實現智能服務。傳統上,AI技術通常需要在單個實體中進行集中數據收集和訓練,但是MEC服務器由於數據隱私問題和大數據量通信開銷無法計算。基於上述背景提出聯邦學習(FL)通過協調多個移動設備聯合訓練AI模型,而無需泄露本地的數據。

為了提高安全性和聯邦學習的可擴展性,區塊鏈的分布式賬本技術可以很好的代替聯邦學習的中心服務器。特別當blockchain和FL結合形成的新范式FLchain,可以轉換MEC網絡成為分布式的,安全和隱私增強的系統。本文總結了MEC網絡中的FLchain的基本概念和發展方向,討論了FLchain的主流問題,包括通信開銷,資源分配,獎勵機制和隱私保護。

二、引言

現代生活中,智能手機、筆記本電腦和平板電腦等移動設備的感知和計算能力無處不在。為了適應人工智能服務對計算和存儲的需求,提出了移動邊緣計算(MEC)。隨着物聯網數據量的不斷增加以及對下一代無線網絡中數據隱私的日益關注,在中央服務器上實施集中式人工智能訓練可能不再合適。聯邦學習(FL)最近已成為一種分布式人工智能方法,通過協調多個設備來執行人工智能訓練,而無需共享原始數據以增強隱私和節省網絡資源。

然而,目前的FL系統仍然存在一些問題。

  1. 用戶需要完全信任MEC服務器進行模型聚合,但在現實的無線網絡中並不總是能夠做到這一點。
  2. 盡管FL有助於增強用戶隱私,但將學習參數傳輸到MEC服務器容易受到安全瓶頸的影響,例如惡意威脅,這些威脅可能會修改或竊取本地更新的信息[5]。此外,一旦服務器受到攻擊,MEC服務器對模型聚合的依賴將引入單點故障瓶頸,從而中斷整個FL系統。
  3. 考慮到現代邊緣計算網絡的高可擴展性,單個MEC服務器無法聚合從數百萬設備上傳的所有更新。因此,迫切需要在不使用中央服務器的情況下開發更分散的FL方法,以解決安全性和可擴展性問題,從而實現下一代智能邊緣網絡。

區塊鏈作為賬本技術[6]可以為基於FL的智能邊緣計算提供解決方案,因為它具有分布式、不變性和可追溯性等特點。區塊鏈是由共識機制(例如工作證明(PoW))控制下的散列值鏈接的區塊的一種形式,礦工利用數字簽名挖掘區塊,使鏈接區塊不受修改和變更的影響。通過使用區塊鏈,FL可以通過分散的數據分類賬來實現,而無需任何中央服務器來降低單點故障的風險,所有網絡實體以透明的方式跟蹤任何更新事件和用戶行為。此外,可以通過事務日志輕松跟蹤在訓練過程中修改或更新模型參數的來源,這在傳統FL系統中是無法滿足的。因此,FL和區塊鏈的整合創造了一種稱為FLchain的新范式,它潛在地改變了具有分散和安全性質的智能邊緣網絡。

在FLchain中,每個設備都可以作為一個客戶端,以分散的方式更新和聚合學習模型。每個客戶端首先初始化一個數據模型並計算學習參數。然后,它以事務的形式將計算出的模型更新上傳給一組礦工。挖掘者在一段時間后將客戶端創建的事務(包含本地更新)合並到一個區塊中,然后由挖掘者通過挖掘過程進行驗證。一旦區塊被挖掘,它將被附加到區塊鏈並廣播到整個網絡。每個客戶端下載最新更新的區塊,並計算全局模型的新版本。迭代該過程,直到全局損失函數收斂或達到所需精度。通過這種方式,區塊鏈有助於消除對中央服務器的需求,從而潛在地降低通信成本並實現更好的智能網絡可擴展性。此外,區塊鏈通過不可變的區塊分類賬為FL訓練提供了高安全性。

本文主要貢獻如下:

  1. 概述了FL和blockchain的基本原理,提出用於邊緣計算的通用框架FLchain
  2. 討論了FLchain中的關鍵技術問題,包括通信開銷,資源分配,獎勵機制和隱私保護
  3. 分析了FLchain在邊緣計算的機遇和可能的應用領域,例如邊緣數據共享,邊緣內容緩存和邊緣眾感知。
  4. 討論了FLchain的關鍵挑戰和未來的發展方向。

三、聯邦學習-FL

自2016年提出以來,FL通過在網絡邊緣與多個移動設備合作提供分布式AI解決方案,改變了許多應用。

FL不是將所有原始數據上傳到雲服務器或者集中數據訓練AI模型,而是通過將AI模型訓練過程直接分配到本地設備來實現分布式學習,以在服務器端(例如,基站(BS)或接入點(AP)的MEC服務器)上構建共享全局模型。

隨着移動硬件的最新發展和對用戶隱私的日益關注,FL對於各種智能邊緣服務(如智能交通和智能醫療)尤其具有吸引力。

例如,在智能車輛網絡中,車輛可以充當學習客戶端來訓練本地模型,並與路邊單元(RSU)協作來構建交通預測模型,旨在構建一個全面的車輛路線圖以減少交通擁堵。

由於基站無法從分布式移動設備收集所有數據用於AI/ML訓練,FL對於在下一代移動邊緣網絡中實現完全智能化至關重要。FL允許設備和BS訓練通用模型,同時原始數據集保存在數據所在的用戶本地。

如圖所示為經典的FL架構,包括分布式設備和聚合服務器,運行流程可以分為4個步驟:

  1. 服務器上的MEC服務器首先選擇計算任務(例如車輛交通分析),以及任務要求(分類任務或回歸任務),以及學習參數(學習率等)。然后,MEC服務器選擇設備子集作為協作訓練的學習客戶端。實際上,MEC服務器可以通過使用合適的客戶端調度機制在不同的更新輪中選擇不同的設備子集,以提高其訓練質量。

  2. 服務器初始化global model並將其發送給所有客戶端,以創建新一輪訓練。在這里,每個客戶機使用自己的數據集訓練模型local model,並計算新的更新。

  3. 每個客戶端將其local model的上傳到MEC服務器進行全局聚合。通過聚合來自客戶端的所有模型,服務器以最小化損失函數的方式構建了一個新的全局模型global model。

  4. 務器將計算出的全局模型廣播給所有客戶端,以便進行下一輪訓練。迭代上述過程,直到全局損失函數收斂或達到所需精度。

四、區塊鏈-blockchain

4.1 區塊鏈基礎

區塊鏈本質上是一個在點對點(P2P)網絡上運行的公共、可信和共享的分布式賬本。

區塊鏈概念背后的關鍵思想是去中心化,即區塊鏈上的數據不受任何單一實體的控制。相反,所有區塊鏈節點(如邊緣網絡中的移動設備和MEC服務器)都有同等權利驗證和管理由共識機制啟用的區塊鏈中存儲的數據。

這種分散功能使區塊鏈能夠抵御數據修改或攻擊。此外,去除中央服務器避免了單點故障的風險,從而提高了區塊鏈系統的可靠性和穩定性。

上圖描述了典型的區塊鏈操作,主要包括3個步驟:

  1. 移動用戶使用其錢包賬戶(包括私鑰和公鑰)創建具有元數據(即用戶ID)、用戶簽名和時間戳的交易。由於移動設備的資源限制,包括挖掘在內的大量計算任務,智能合約執行可以在雲計算上組織和實施。然后,用戶向雲計算服務器提交特定請求的事務,例如物聯網數據任務處理、用戶身份驗證、雲服務查詢等。

  2. 雲服務器發布可用資源並處理用戶的請求。智能合約自動執行交易身份驗證、用戶驗證和交易(即用戶和服務提供商之間的資產交易)。此外,雲服務器授權區塊鏈礦工(即虛擬機)驗證用戶交易。該事務被添加到未確認事務池中,等待礦工提取該事務。虛擬礦工網絡可以通過協商一致的機制(如PoW)達成協議。

  3. 最快驗證區塊的礦工會將簽名發送給其他礦工進行驗證。如果所有礦工達成協議,則驗證區塊及其簽名將按時間順序附加到區塊鏈。最后,所有網絡實體接收該塊並同步區塊鏈的副本。

區塊鏈的運營也會產生延遲和能耗方面的成本。事實上,區塊鏈挖掘任務的執行,例如區塊驗證和礦工之間的信息交換,需要消耗大量能源。為了將新交易附加到區塊鏈,區塊鏈用戶或礦工需要運行一個挖掘謎題,例如PoW,它通常很復雜,需要大量的計算和存儲資源。在移動區塊鏈網絡中,這一問題變得更加重要,移動設備的電池和內存通常有限,這使得它們很難適應所有挖掘任務。此外,采礦組礦工之間的重復信息交換也需要大量帶寬資源,並導致高通信延遲,這可能會降低FLchain訓練的整體性能,例如延遲模型聚合。

4.2 區塊鏈類別

區塊鏈可分為三種主要類型,包括公共鏈(或無許可)、私人鏈(或許可)和聯盟鏈。

  • 公共鏈

    公共鏈是一個開放的網絡,允許每個人加入並進行交易,以及參與共識過程。最著名的公共區塊鏈包括比特幣和以太坊,以及開源和智能合約區塊鏈平台。例如,以太坊是一個分布式公共區塊鏈網絡,類似於比特幣等大多數平台。以太坊的一大優勢是通過在以太坊虛擬機上運行的智能合約實現自動數字資產管理的能力。區塊通過礦工管理的PoW算法驗證並附加到區塊鏈,以在網絡中的所有節點之間實現安全、防篡改的共識。每個區塊都需要消耗一定數量的gas(以太坊的貨幣),作為其執行的一部分,並為采礦者支付開采區塊的報酬。

  • 私人鏈

    私人鏈是一個由權威機構管理的僅限邀請的網絡,區塊鏈中的所有活動(如交易寫入和檢索)都需要通過驗證機制進行許可。私有區塊鏈假設網絡由單個實體運營,而聯盟區塊鏈則在一組所有者的管理下運營。它們限制用戶訪問網絡和網絡成員執行的事務。由於能夠在網絡中提供協作控制,聯盟區塊鏈能夠實現組織間的互聯業務轉型和創新商業模式。

  • 聯盟鏈

    聯盟鏈是一個由多個組織共同管理的區塊鏈平台。Hyperledger Fabric是一個受歡迎的區塊鏈聯盟平台。RealDealGeFaby是由Linux基金會在2015創建的財團BuffClinux平台。與其他區塊鏈技術類似,Hyperledger Fabric有一個賬本,使用稱為鏈碼的智能合約,並協調交易組織中的參與者。然而,管理網絡訪問的概念是不同的。Hyperledger結構網絡的成員必須得到會員服務提供商的信任,而不是允許網絡中所有成員參與的開放式無權限系統。Fabric采用了一種新的體系結構方法,改進了區塊鏈應對不確定性、資源消耗和性能攻擊的方式。Fabric還可以創建通道,使一組參與者能夠建立單獨的交易分類賬。為了在網絡中達成共識,Fabric使用拜占庭容錯(PBFT),這非常適合於成員部分受信任的企業聯盟。

五、FL和blockchain為什么要結合

5.1 威脅模型和安全需求

威脅模型

  1. 內部威脅

    在FLchain系統中,MEC服務器在訓練過程中假設是半誠實的。在此假設下,MEC服務器遵守規則訓練,但對其他方參數更新好奇,因此可以從區塊鏈上的交易中推斷出一些敏感信息。更具體地說,盡管數據沒有以原始格式顯式共享,但好奇的MEC服務器仍有可能從梯度中竊取訓練數據並大致重建原始數據,尤其是在架構和參數沒有完全保護的情況下。此外,惡意客戶端可以利用和學習數據結構,如從全局模型更新中提取的圖像像素,而無需征得其他客戶端和MEC服務器的同意。

  2. 外部威脅

    在客戶端,對手可以修改數據特征或在原始數據集中注入不正確的數據子集,以將后門嵌入模型,從而改變本地客戶的訓練目標。攻擊者還可以破壞某些客戶端設備,並且攻擊者在學習過程中操縱受損客戶端設備上的本地模型參數,從而導致全局模型更新出錯。此外,對手可以在FL訓練期間在無線通信信道上部署攻擊,以獲取客戶的個人信息。例如,對手可以檢索混合在參數更新包中的敏感用戶信息,如年齡和用戶偏好。此外,外部竊聽者可以獲得對MEC服務器的未經授權的訪問,以便控制模型更新聚合過程。

安全需求

  1. 重要的是為FL訓練提供高度的隱私保護,以確保數據信息安全並鼓勵用戶參與數據訓練。這可以通過使用微擾技術來實現,例如差分隱私技術可以用來保護訓練數據集,防止數據泄露。
  2. 需要威脅管理和攻擊防御解決方案來解決客戶端和MEC服務器端的安全問題。例如,需要在聚合服務器上部署攻擊檢測機制,以評估每個客戶端的權重貢獻,目的是過濾掉敵對客戶端,並在每個通信回合中檢測攻擊,如模型更新中毒攻擊、數據中毒攻擊和規避攻擊。
  3. 在參數交換和更新廣播過程中,保證無線通信信道的安全性和隱私性是非常必要的。使用區塊鏈和智能合約的數據加密、通信身份驗證和安全賬本配置是滿足FL通信中這些安全要求的有用解決方案。
  4. FLchain系統中的移動設備能夠建立事務並與相關MEC服務器通信,以進行安全的FLchain訓練。每個設備還應投入資源(如存儲和計算)來訓練學習模型和運行挖掘以獲得額外利潤。

5.2 FL和blockchain結合

區塊鏈憑借其獨特的特性,在邊緣網絡中提高FL的安全性方面具有巨大的潛力。

  1. 使用分散的區塊鏈可以消除FL訓練中對中央服務器的需求。相反,一個共享的不可變賬本用於聚合全局模型,並將全局更新分發給學習客戶端,以便在設備上進行直接計算。模型聚合的非集中化不僅降低了單點故障的風險,從而提高了訓練可靠性,而且還降低了在全局模型聚合中對中央服務器造成的負擔,尤其是在邊緣網絡具有多個客戶端時。學習更新被附加到不可變的塊中,用於在訓練期間在客戶端之間進行信息交換,從而確保針對外部攻擊的訓練的高安全性。將區塊復制到整個網絡還允許所有客戶端驗證和跟蹤訓練進度,以確保FLchain系統的高度信任和透明度。
  2. 消除FLchain模型聚合的中央服務器可能會降低通信成本,並吸引更多移動用戶參與基於其分散網絡拓撲的數據訓練,從而提高移動邊緣網絡的可擴展性。

六、聯邦區塊鏈架構-FLchain

從經典聯邦學習架構訓練過程中,我們可以看到,FL依賴於集中式服務器,即MEC服務器進行模型聚合,這在無處不在的無線網絡中存在故障和可伸縮性問題。此外,這種集中式FL架構無法吸引遠離服務器的設備進行訓練,從而限制了整個系統的學習性能。

一個替代方案是,FLchain通過將全局模型計算直接分配到每個設備上而不需要任何集中式服務器。FLchain為不可變區塊鏈提供的FL訓練過程提供了獨特的安全功能,從而實現了可靠的智能分散邊緣網絡。FLchain架構如上圖所示,包括一組MEC服務器和連接區塊鏈網絡中的分布式設備。由於高計算能力,MEC服務器通常被選擇執行挖掘任務以維護區塊鏈網絡,而移動設備可以參與本地訓練或挖掘,或者同時執行訓練和挖掘任務。FLchain程序包括以下幾個步驟:

  1. 一組MEC服務器使用其關聯設備初始化,用於邊緣網絡中的特定學習任務(例如聯邦醫療分析)。每個MEC服務器作為一個學習客戶端,將其資源用於運行區塊鏈共識(或挖掘),本地移動設備運行FL訓練算法。

  2. 每個訓練節點使用自己的數據計算本地模型,然后通過創建事務將本地模型通過區塊鏈傳輸到其關聯的MEC服務器。

  3. MEC服務器從其客戶機收集事務,並根據定義的數據結構(例如Merkle樹)存儲它們,然后在特定時間段創建一個塊。每個塊都由一個唯一的散列值以及一個時間戳和一個nonce標識,其目的是防止未經授權的塊復制。然后,MEC服務器參與挖掘過程(例如PoW),以驗證新創建的塊,並在所有MEC服務器之間達成共識。可以選擇MEC服務器作為管理器,在其時間段內協調挖掘過程。此外,設備還作為全部或部分節點參與挖掘區塊,以獲得額外利潤。

  4. 挖掘完成后,驗證的塊被添加到區塊鏈中,並通過服務器設備通信廣播到所有本地設備。現在,本地模型更新安全地存儲在區塊鏈中。

  5. 本地設備下載包含其他設備的所有本地更新的塊。這允許每個設備根據預定義的模型聚合規則(如加權和規則或基於錯誤的聚合規則)直接在本地設備上計算全局模型。換句話說,全局模型是在本地計算的,而不是像傳統的FL體系結構那樣在中央服務器中計算的。迭代訓練過程,直到全局損失函數收斂或達到所需精度。

在FLchain訓練中,訓練樣本可能不是完全確定的。例如,在聯邦圖像分類任務中,客戶端可能具有不同的圖像數據集,這些圖像數據集具有不同的像素分辨率,也可以通過傳感環境進行連續更新。同時,區塊鏈中的交易存儲需要精確的內容匹配,其中交易的哈希值必須是其內容的唯一值。

所以在FLchain訓練期間,如何實現訓練數據和區塊鏈存儲之間的同步是一個重要問題。一種可能的解決方案是針對模型交換期間的不同訓練示例開發自適應哈希值生成機制,例如,在數據塊公式中連續重新配置其操作哈希參數,這有助於實現穩定可靠的區塊鏈存儲和操作。

通過使用區塊鏈,FLchain由於其分散的網絡拓撲結構,可以在學習過程中吸引更多的設備以獲得更好的可擴展性。特別是關於學習更新的信息以不變的區塊形式是安全的,這提高了邊緣網絡中訓練的安全性。FLchain以其分散和安全的性質,有望為實現智能和可擴展的邊緣網絡提供具有安全保障的有吸引力的解決方案。

下表總結了經典FL和FLchain之間的比較。除了優點外,FLchain還存在一些缺點,例如區塊鏈挖掘、資源管理和好奇礦工的安全可能帶來的延遲,這些都需要在系統設計中加以考慮。

優勢 缺點 執行環境
classical FL •能夠在本地設備上訓練AI模型,而無需共享原始數據
•增強用戶數據隱私保護
•節省網絡資源,例如帶寬,發射功率等。
•仍然存在安全問題(例如,數據攻擊、單點故障)
•遠程設備與服務器的通信延遲高。
•模型匯總不透明,缺乏激勵機制。
•所有設備和服務器都需要為協作訓練建立可靠的通信。
•學習客戶端或設備需要信任中央服務器。
FLchain •不需要中央服務器
•消除單點故障風險
•可以在設備和服務器之間建立信任
•提高邊緣網絡的可擴展性
•區塊鏈挖掘可能需要的延遲和能源成本。
•開放式更新共享可能帶來的隱私風險。
•訓練數據和區塊鏈存儲之間可能存在沖突。
•移動設備能夠訓練學習模型並運行挖掘以獲得額外利潤
•FLchain中使用的區塊鏈平台能夠在所有移動設備之間建立分散的數據網絡,用於共享訓練。

七、FLchain的設計和用例

在本節中,根據最近與聯邦區塊鏈集成相關的工作,介紹邊緣計算中FLchain的設計和關鍵用例。我們涵蓋了FLchain設計中的四個關鍵領域,包括通信成本、資源分配、激勵機制、安全和隱私保護。在每一個領域中,都會提出問題陳述,並討論一些關鍵用例。然后,總結了最重要的設計特征的主要經驗教訓,並強調了進一步研究的前景。

7.1 通信開銷

1、問題描述

在FLchain中,每個客戶端通過運行在邊緣網絡頂部的區塊鏈賬本計算和更新本地模型,並且在本地設備上執行全局模型聚合,而無需中央服務器。盡管消除了與中央服務器通信造成的網絡成本(例如延遲),但區塊鏈的使用引入了與區塊挖掘相關的新成本。因此,FLchain的延遲公式需要考慮設備訓練延遲、更新通信延遲和塊挖掘延遲以及訓練准確性感知。

2、用例

論文《Blockchained On-Device Federated Learning》中的工作是首次嘗試對FLchain中的通信成本進行整體分析。在這里,MEC服務器通過對接收到的本地更新執行交叉驗證,充當既參與訓練又進行挖礦的礦工。為了生成塊,礦工們合作解決PoW問題,直到他們找到一個nonce值或從其他礦工那里收到生成的塊。

通過在通信階段使用加性高斯白噪聲信道模型和在挖掘階段使用區塊傳播延遲模型,建立了每輪通信中計算、通信和區塊生成延遲的集成框架。最終目標是找到一個最佳的塊生成速率,最小化PoW過程產生的平均延遲,同時避免在塊生成階段由於不正確的全局更新而導致分叉的可能性。

與經典FL方法相比,FLchain在不同模擬設置下實現了更低的系統延遲和更好的學習精度。《Federated Learning With Blockchain for Autonomous Vehicles: Analysis and Design Challenges》中的另一項研究對車輛網絡中的FLchain進行通信成本分析,如圖4所示:

區塊鏈的使用可能有助於克服集中故障問題,並通過獎勵機制吸引不可信的車輛來提高FL訓練性能,從而增強智能車輛網絡的可擴展性。在這種情況下,每輛車都充當FL客戶,通過區塊鏈網絡中的礦工進行本地訓練並與其他車輛進行交流。更具體地說,車輛及其相關礦工的FL訓練和模型更新延遲通過共同考慮模型計算、模型卸載和區塊鏈挖掘如下:

\[T_{n}=\frac{\tau_{\text {out }}+\mathcal{T}_{g}}{1-p_{\text {fork }}}+\tau_{\text {global }}+\tau_{g d n} \]

這里,\(\tau_{out }\)是PoW過程中本地更新轉儲的超時,\(\mathcal{T}_{g}\)是塊到達/生成延遲,\(p_{fork }\)是分叉概率,\(\tau_{global }\)\(\tau_{g d n}\)分別是全局模型更新和全局模型下載的延遲。然后,根據不同信道條件下的傳輸幀大小、塊大小和塊到達率,通過在線延遲最小化算法優化延遲。仿真結果揭示了聯合考慮通信延遲和一致性延遲在實現最優FLchain訓練延遲方面的好處,以及區塊鏈參數(例如區塊到達率)對整體模型學習性能的積極影響。

3、經驗和展望

  • 通信成本是在實際部署FLchain系統之前需要解決的關鍵問題。當前大多數FLchain方案通過考慮設備訓練延遲、與礦工的通信延遲以及挖掘延遲來分析通信成本[27-28],而[29]中的工作主要關注邊緣計算延遲和參數傳輸通信延遲。

  • 可以采用一些解決方案來降低通信成本,例如基於獎勵的訓練[28]和根據學習精度和帶寬資源約束調整塊到達率[29]。

  • 大多數當前解決方案[27]、[28]依賴於PoW共識機制,這通常需要大量帶寬和能源來實施采礦過程。因此,應考慮開發輕量級區塊鏈,以促進FLchain,旨在增強用戶的訓練體驗並降低系統成本。

7.2 資源分配

1、問題描述

資源分配對於支持FLchain的運營非常重要。在客戶端,當設備需要為數據訓練和區塊鏈參與共享其計算和存儲資源時。在MEC服務器端,還需要進行資源管理,以確保以最小分叉概率將包含本地更新的塊附加到區塊鏈的方式進行有效挖掘。

2、用例

論文《Resource Management for Blockchain-enabled Federated Learning: A Deep Reinforcement Learning Approach》中的工作為FLchain提出了一種基於DRL的資源分配策略,以解決聯邦數據訓練中的兩個關鍵問題,包括塊挖掘導致的延遲增加和用於本地訓練的移動設備的資源限制。

為了克服這些挑戰,服務器(例如,BS)和移動設備之間的更新通信被表示為\(M/M/c\)隊列模型,其中\(M\)表示泊松到達和指數服務過程,\(c\)表示服務節點的數量。例如,在FLchain通信中,新事務在被追加到塊之前存儲在隊列中,挖掘贏家是負責運行PoW謎題的服務節點。通過使用馬爾可夫過程,根據上行鏈路和下行鏈路帶寬資源約束,以最小化能量消耗和訓練延遲,同時最大化模型准確率的方式導出獎勵函數。實驗證明了該算法的有效性,與貪婪算法相比,該算法可以降低高達72%的能量消耗。

DRL在[41]中還用於資源分配,允許模型所有者在事先不知道能量水平和用戶移動性不確定性的情況下,找到關於能量和通道的最佳決策,以執行訓練。提出了一個模型所有者的隨機優化問題來最大化通信輪數,同時最小化能量和信道帶寬的資源使用。行動策略的使用允許模型所有者確定應使用哪個渠道將全局FL模型傳輸給客戶,並估計應釋放多少能源以最小化系統成本。最近,考慮了一種資源管理方案,以分析MEC網絡中具有數字孿生的FLchain的學習精度和資源消耗之間的權衡[42]。設計了一個基於DPoS共識的輕量級區塊鏈平台,以支持FLchain中的模型更新和區塊挖掘。通過使用深度神經網絡作為所有物聯網用戶的策略調度器來解決數據中繼優化問題,還采用DRL方法來實現最佳用戶和資源調度,以提高通信效率和訓練性能。為了評估提議的FLchain方案的性能,在一個有100個最終用戶和4個BSs的模擬環境中使用了真實世界的MNIST數據集和Fashion MNIST數據集[43]。通過仿真,DRL證明了它在為用戶調度和帶寬分配找到最佳解決方案方面的有效性,同時確保了在各種網絡環境下可接受的學習速率。

3、經驗和展望

  • 資源分配是確保FLchain數據訓練的最佳資源分配的一項重要任務。大多數最先進的技術[40-41]使用DRL在能量和信道帶寬可用性條件下為FLchain系統實施資源分配策略。

  • 基於DPO共識,采用了輕量級區塊鏈平台,以支持FLchain中的模型更新和區塊挖掘[42],這有可能降低FL訓練的能耗。

  • 通過聯合考慮塊生成[44]、模型到達率和設備上學習率,可以考慮一些可能的方向來進一步改進資源分配。通過這種方式,我們可以在基於FL的智能邊緣網絡中實現礦工和本地設備的協作資源分配解決方案。

7.3 激勵學習

1、問題描述

盡管FL在保護用戶隱私的同時促進了協作學習,但它仍然面臨着激勵客戶參與FL過程並貢獻其數據和計算資源的挑戰。如果沒有適當的激勵機制,客戶可能不願意參加數據訓練,這將降低所設計的FL系統的可擴展性。最近,區塊鏈已成為促進透明經濟機制設計的一個有吸引力的工具,以促進FLchain系統中的FL訓練。

2、用例

一些文獻中介紹了FLchain激勵學習的用例。例如,[46]中的工作為FLchain實施了嚴格的獎勵政策設計,在移動用戶的合理假設下,提供了實現預期目標的經濟解決方案。其關鍵目標是為FLchain提供重復競爭,以便理性的用戶遵循協議並最大化其經濟利潤。在某一輪訓練中選擇的每個用戶都可以選擇上一輪其他用戶更新的模型,以通過區塊鏈更新其模型。得票最高的用戶將在下一輪學習中獲得獎勵。通過新的拍賣理論(如多獎競爭理論)對所提出的激勵機制的效率進行了研究,顯示了良好的激勵相容性。

[47]中還介紹了FLchain學習的激勵機制。設計了一個基於區塊鏈的分散聲譽系統,以確保在邊緣計算環境中進行可信的協作模型訓練。在這種情況下,區塊鏈非常有助於解決廣泛的問題,如數據安全、模型訓練的中心性以及故障和妥協的集中點。為了提高全球模型訓練的績效,激勵是非常必要的,以招募更多具有高質量數據源的移動用戶。

[48]中的工作考慮了數據所有者、雲供應商和AI開發者,在基於區塊鏈的雲計算中的不可信任AI市場中進行協作學習的FLchain方案,旨在保護隱私和資產所有權。一些系統鏈碼功能被配置為激勵所有客戶在分布式賬本中不可變地記錄其行為,以便區塊鏈可以驗證FL訓練中用戶的行為。在Hyperledger Fabric區塊鏈上與三個不同的組織建立了一個原型,每個組織都有24個對等點通過區塊鏈執行共享AI模型訓練,顯示了在不同網絡設置下較低的網絡延遲和提高的吞吐量(例如每秒事務數)。

[49]中設計了一個分散的、可公開審核的FLchain系統,該系統具有信任和激勵,以加速FL訓練中的合作,而不必擔心實體之間的信任。事實上,區塊鏈有望在FL過程中安全存儲訓練客戶端和FL模型的信息,而挖掘有助於驗證FL計算中的錯誤更新。特別是,通過基於區塊鏈的激勵機制,對發現任何不當行為的客戶進行獎勵,並對受影響的訓練客戶端進行補償。

為FL設計了一種價值驅動的區塊鏈激勵機制,稱為DeepChain,旨在鼓勵各方在協作學習期間正確行為並積極分享獲得的局部梯度[50]。每一方可根據其貢獻獲得獎勵或處罰。學習激勵的好處有兩方面,包括吸引更多客戶加入訓練,以及確保客戶在本地模型訓練和更新交流中誠實。此外,模型更新由區塊鏈進行驗證和審計,而梯度收集和參數更新由所有參與者通過賬本網絡進行監控,從而確保FL過程的公平性。

除了激勵之外,FL服務器還需要在FL訓練后向客戶支付供款成本。為了解決這個問題,在[51]中考慮了一種支付方法,通過設計一個類抽樣驗證錯誤方案來驗證客戶端的梯度,以指定合理的設備獎勵。智能合約集成在Hyperledger結構區塊鏈中,以透明和可信的方式實現梯度驗證和獎勵計划[52]。通過這種方式,客戶可以通過保留其數據的所有權和獲得激勵而受益,而模型所有者可以訪問更大的數據集,從而增強整個外語學習的穩健性。

3、經驗和展望

  • 為FLchain系統設計激勵機制,已經提交了一些文獻著作,其共同目標是在AI訓練中吸引更多的客戶和數據集,並提高整體FLchain學習的穩健性[46]、[47]、[49]。

  • 區塊鏈提供了獨特的功能(例如,分散化、可信),以便在FL訓練中實現安全的激勵解決方案,其中模型更新由區塊鏈驗證和審核,而梯度收集和參數更新由所有參與者通過賬本網絡進行監控,從而確保FL過程的公平性[50],[51]。

  • 激勵過程中梯度更新的驗證成本尚未考慮。在未來,重要的是分析獎勵利潤和系統成本之間的權衡,這對客戶和模型所有者都有利,拍賣理論可以用於激勵分析[53]。

7.4 安全和隱私保護

1、問題描述

為了確保FLchain系統的魯棒性和安全性,構建安全和隱私保護機制至關重要。中毒攻擊和數據隱私威脅等攻擊會使FLchain系統變得脆弱和危險,尤其是在由多個設備和服務器組成的分布式邊緣網絡中。因此,在大規模部署FLchain之前,迫切需要開發解決安全和隱私問題的解決方案。

2、用例

在最近的工作中,已經有一些考慮了與FLchain安全保護相關的用例。[55]中的工作調查了一個FLchain系統,其中用戶通過區塊鏈網絡中的邊緣服務器參與協作學習並交換其本地更新,同時數據存儲在分布式哈希表中。考慮了攻擊模型;也就是說,對手可以嘗試使用設計的偽造數據訓練局部模型,並在更新傳輸之前替換全局模型,以操縱訓練輸出。通過調整區塊鏈挖掘的難度級別,可以降低對訓練數據進行中毒攻擊的可能性,而不會降低訓練性能。

[56]研究了基於區塊鏈的分散安全多方學習系統。每個客戶端計算並廣播其本地模型,並在校准后使用自己的數據集通過區塊鏈執行從其他客戶端接收的模型。在模型廣播和模型校准過程中,考慮了FLchain中的兩種拜占庭攻擊,這兩種攻擊可以通過使用鏈外樣本挖掘和鏈上挖掘的合作挖掘策略來解決。

在FLchain的隱私保護方面,也提出了一些解決方案。[57]中介紹了一種基於區塊鏈的FL架構,稱為PriModChain,用於工業物聯網網絡,重點是模型訓練和更新傳輸中的隱私保護。對局部生成的帶有人工噪聲的模型應用了一種差分隱私技術,以減少識別個人記錄的可能性。通過使用智能合約,可以確保中央機構和分布式用戶之間交換全局ML模型的通信安全,這有助於達成更新驗證協議,並為FL更新提供透明度。此功能強制執行無偏和錯誤費用數據操作,從而增強FL流程針對外部數據威脅的安全性和可靠性。

在使用差分隱私的FLchain中,人工噪聲旨在通過使用隱私機制(如Laplace、Duchi或分段機制)干擾訓練梯度,然后再到其相關MEC服務器消除。然后,所有MEC服務器合並所有客戶端的差異隱私更新,並執行一致性以生成聚合的全局梯度,然后將該梯度廣播給所有參與的客戶端進行下一輪訓練。在全局聚合之后,單個節點無法在區塊鏈模型交換期間反轉基本事實以檢索包含客戶端更新的實際向量[58]。即使在客戶機與其關聯的MEC服務器之間的公共模型更新共享中,該服務器執行多個查詢以嘗試檢索客戶機的實際更新,客戶可以通過跟蹤區塊鏈分類賬日志或使用MEC網絡中部署的智能合同的可追溯性來實現這種未經授權的行為[59]。

[60]中的工作為基於區塊鏈的分布式學習提出了一個可擴展的隱私架構,通過在不受信任的學習方之間的隱私保護聯盟中驗證模型上的源質量和機密性。攻擊可以在訓練期間從一方竊取私人數據,或者嘗試根據生成的梯度重建訓練集。在這種情況下,可以采用差分隱私技術,以便如果輸出獨立於輸入數據的特定數據點,則模型計算被認為是差分私有的。

3、經驗和展望

  • 在FLchain中,攻擊可以嘗試使用設計的偽造數據訓練局部模型,以替換全局模型,並在模型傳輸過程中修改參數值,以操縱訓練輸出。現有的大部分工作都集中在建立攻擊檢測機制,用於FLchain中的模型訓練和更新傳輸[55]、[57]、[60]。

  • 在不降低訓練性能的情況下,通過調整挖掘難度,可以降低地面攻擊的可能性(例如,對訓練數據的攻擊)。智能合約有助於在中央機構和分布式用戶之間建立安全通信,以進行安全模型更新[57]。

  • 對於隱私保護,FLchain中可采用差異隱私技術,因此,如果輸出獨立於輸入數據的特定數據點,則模型計算被視為差異隱私[57],[60]。通過這種方式,將微分隱私應用於帶有人工噪聲的局部生成模型,以減少個人記錄識別的可能性。在未來,需要部署更安全的空間分解算法。例如,在[61]中提出了不可行拉普拉斯噪聲規定的解決方案,以解決差分隱私中拉普拉斯機制的對稱分布問題。這樣,通過將拉普拉斯噪聲相乘,將不可行噪聲添加到私有樹每個中間節點的隨機選擇的葉子樹中,有助於防止噪聲消除的可能性,並滿足微分隱私。

  • 區塊鏈挖掘和FLchain本地訓練都應考慮攻擊模型。例如,貪婪的礦工可能通過增強采礦能力來利用FLchain系統,從而控制礦工組修改數據塊,或者Sybil攻擊的雙重支出問題會使采礦效率低下[62]。此外,為了增強FLchain中的隱私,一些技術(如同態加密)對於FL訓練中的隱私保護外包存儲和計算非常有用,其中數據可以在FL模型聚合的區塊鏈上共享之前進行加密。這在醫療保健等具有高度敏感性的健康數據和個人信息以及非常需要隱私保護的應用程序中非常重要。

八、FLchain在邊緣計算中的應用

8.1 用於邊緣數據共享的FLchain

在本節中,我們重點分析區塊鏈FL在一些流行應用領域的應用,如邊緣數據共享、邊緣內容緩存和邊緣眾感知。

1、用於邊緣數據共享的FLchain

物聯網數據共享是邊緣網絡中的關鍵服務之一,旨在通過共享環境傳輸數據,以基於邊緣計算的方式服務最終用戶。在第五代(5G)及以上網絡中,提供可靠且可擴展的物聯網數據共享解決方案以滿足用戶日益增長的數據使用需求非常重要。FLchain具有分布式學習和安全性特點,可促進邊緣數據共享。

例如,在[67]中提出了一種FLchain方案,用於在分布式多方(如具有BS的工業物聯網網絡中的移動設備)之間共享隱私保護的物聯網數據。給定數據共享請求,將執行多方數據檢索過程,以根據注冊記錄尋找相關方(或數據所有者)作為委員會。這些委員會節點充當礦工,訓練全局模型輸出訓練結果,然后返回給請求者。它們還執行由給定時間段內收集的數據共享事務組成的數據塊挖掘。因此,數據所有者和數據請求者可以實現可靠、快速的數據共享,而共享記錄則存儲在區塊鏈上進行跟蹤。

[30]中針對車輛互聯網(IoV)提出了另一個基於FLchain的邊緣計算車輛數據共享框架,如圖5所示,包括三個關鍵階段:節點選擇、局部訓練和全局模型更新。提出了一個節點選擇問題,選擇參與訓練的車輛,然后生成模型更新以構建全局模型。更具體地說,每輛車充當FL客戶端,與宏基站(MBS)的聚合服務器協作共享數據。具有不同服務需求(例如交通流估計或路徑選擇)的車輛可以向MBS提交數據共享請求。通過使用連接車輛的累積車輛數據集運行共享全局模型,MBS將數據共享過程轉換為計算任務,以便使用共享成本最小化的DRL算法處理來自車輛的共享請求。特別是,為了提供車輛數據共享的安全性和可靠性,在邊緣車輛網絡的頂部部署了一個不變的區塊鏈賬本,以實現模型參數更新的驗證,並以分散的方式將其存儲在塊中。

FL還與分層區塊鏈結合,以在基於邊緣的車輛系統中構建知識共享[68]。訓練的參數信息可通過IoV網絡共享,IoV網絡由RSU和BSs組成,可根據其區域特征在輕量級知識證明(PoK)共識機制上運行的本地區塊鏈管理下划分為單獨的組。為了實現智能分布式學習,在特定區域的車輛和RSU之間執行FL過程,然后將訓練好的模型與RUSs BSs網絡上的全局FL網絡共享。

為了在物聯網用戶之間實現安全的物聯網數據協作,在[69]中還研究了私有數據中心、公共數據中心和區塊鏈網絡之間的FLchain框架。在此,數據中心旨在收集基於FL的物聯網環境中的數據,FL可以利用物聯網設備的計算資源來構建大模型。然后,帶有參數的模型存儲在公共數據中心的分布式數據存儲系統中,並具有加密保護。采用基於智能合約設計的區塊鏈,提供靈活、安全的數據管理,支持對用戶之間數據使用的訪問控制。對人體運動數據集的仿真證實了可穿戴傳感器網絡在訓練精度和安全性方面的高性能。

2、用於邊緣內容緩存的FLchain

由於大規模移動邊緣網絡的高數據分布,FLchain可以提供分布式AI解決方案[70],以支持邊緣網絡的智能和安全內容緩存。事實上,從物聯網設備下載的數據可以由MEC服務器緩存,FL在MEC服務器中發揮着創建智能緩存策略的作用,以應對現代物聯網網絡中移動數據的爆炸性增長。FL可以幫助克服傳統集中式學習方法在高度隱私方面面臨的挑戰,因為移動用戶可能不完全信任第三方服務器,因此不願將其私有數據共享給MEC服務器。同時,區塊鏈將有助於在用戶和MEC服務器之間建立信任,以實現可靠的內容緩存,而無需額外的網絡管理基礎設施。

[71]中FL可以與區塊鏈集成,為MEC網絡中的邊緣內容緩存提供安全的學習方案。在這種情況下,物聯網設備可以使用自己的數據集協同訓練神經網絡,然后將計算模型遷移到MEC服務器進行全局聚合。最終目標是估計流行文件,以提高網絡邊緣的總體緩存命中率。為了解決FL訓練帶來的通信延遲問題,采用梯度壓縮方法減小卸載參數的大小。然后,集成基於區塊鏈的智能合約,在FL通信輪次期間在MEC服務器和物聯網用戶之間建立可信的訓練驗證協議。在MovieLens數據集上實驗表明,與傳統的基於FL的緩存算法相比,在高緩存命中率方面有了顯著的改進。FL還可以通過支持MEC網絡中內容替換的分布式DRL訓練來實現智能邊緣數據緩存。移動用戶可以在本地學習和訓練共享模型,而無需將原始數據共享到網絡,而基站的雲服務器從分布式用戶收集更新,通過平均本地更新來運行公共模型。基於用戶和雲的合作,內容被描述為一個馬爾可夫決策過程,然后由DRL算法求解,以在保持學習精度的情況下優化緩存命中率。

[73]中采用FL來訓練DRL代理,為MEC服務器上的智能內容緩存提供指導,從而優化MEC系統中的通信和計算成本。在所考慮的場景中,最終用戶依靠FL流程直接實施數據DRL訓練,而無需將原始數據和個人信息上傳到MEC服務器以保證隱私。然后,多個MEC服務器協調構建一個全局DRL模型,旨在最大限度地降低系統成本,並在邊緣網絡上實現頻譜資源節約。

3、用於邊緣眾感的FLC鏈

移動眾感知系統旨在利用無處不在的移動設備從物理環境中感知和收集數據,以執行數據分析任務。傳統的集中式AI/ML架構通常用於實現智能移動眾感知[74],但它們需要直接訪問感知數據,這會引起隱私問題。此外,利用單個服務器處理所有感測數據的效率不高,尤其是當數據通常分布在大規模網絡中時。FLchain不僅支持高度可擴展的智能邊緣數據眾感知解決方案,還基於FL和區塊鏈集成提供高度隱私和安全性。

例如,在[65]中研究了FLchain方案,以構建基於無人機(UAV)的移動眾感知系統,如圖6所示。區塊鏈通過一個不變的賬本將無人機與數據任務發布者互連,從而構建一個分散的學習網絡,確保無人機之間的數據訓練和模型交換得到監控和跟蹤,以進行攻擊檢測和數據修改預防。

雖然FL可以保護AI訓練中用戶的隱私,但模型更新中嵌入的數據特征可能會泄露,從而泄露私人用戶信息。為了克服這一挑戰,采用了一種差分隱私技術,在每一輪通信中向局部梯度訓練中注入人工噪聲。然后,整合激勵機制,吸引更多無人機參與AI訓練,以提高整體FL性能。基於MNIST數據集(包括60000個訓練樣本和10000個測試樣本,使用卷積神經網絡作為學習模型)的仿真驗證了該方法的有效性。評估結果證實了無人機的高實用性和低聚合錯誤,同時減少了收斂延遲。

在[76]中基於邊緣計算中物聯網的FL設計了一個基於激勵的眾感知/眾包架構。在成功地將其計算參數上傳到MEC服務器后,每個客戶端都可以獲得獎勵,以吸引更多用戶為運行AI模型貢獻計算資源。該激勵過程由兩階段Stackelberg博弈建模,該博弈顯示了在不同系統設置下效用增益提高22%,優於啟發式方法。

[77]基於物聯網環境中的集成FL區塊鏈架構研究了另一種邊緣眾包方案。構建了一個分層眾包授權FL系統,用於在網絡邊緣實現分布式ML訓練。最終目標是優化設備制造商的服務質量,同時使用不同的隱私技術保護隱私。為了安全保證,區塊鏈與FL訓練相結合,以檢測和防止惡意攻擊修改梯度更新,並審計FL客戶端(如物聯網設備)的參數更新。實現結果表明,該算法具有訓練精度高、安全性好、系統延遲低等優點。

九、挑戰和未來方向

本節主要討論FLchain中的一些獨特挑戰,包括安全問題、通信和學習融合問題、經濟問題、剽竊問題以及邊緣計算系統的延遲要求。還總結了一些可能的研究方向。

9.1 FLchain的安全問題

盡管區塊鏈可以為邊緣計算中的FL訓練提供分散化和可追溯性,但最近的研究發現區塊鏈仍然存在自身的安全問題。

例如,在區塊鏈平台[78]中,“51%攻擊”是一個嚴重的安全問題,在區塊鏈平台中,一組強大的礦工可以利用網絡50%以上的采礦能力控制采礦。這些礦工可以修改區塊數據,甚至阻止區塊附加到區塊鏈,從而中斷用戶(如FL客戶端)和FL所有者(如MEC服務器)之間的通信。

另一個安全問題是分叉攻擊[79],其中產生不同的區塊鏈,導致區塊更新規則發生變化,從而使區塊鏈中的同步區塊驗證無效。這種分叉攻擊可能誤導FL訓練過程中的區塊鏈節點。具體來說,某些節點可以在迭代中使用不同的全局參數來訓練全局FL模型,從而導致錯誤的FL模型聚合。

在FL系統集成區塊鏈之前,需要解決其他攻擊,如對智能合約的雙重支出攻擊和重入攻擊[80]。來自對手的偽參數更新也是一個安全瓶頸[81],它可以模擬某個客戶端並廣播偽參數。這樣的對手可能故意廣播礦工在挖掘過程中無法識別的虛假樣本,從而導致模型聚合不正確。

為了克服這些挑戰,在[82]中提出了一種解決方案,使用挖掘池策略來提高挖掘過程的效率,解決安全瓶頸,例如51%的漏洞,減少區塊和事務傳播延遲。然而,挖掘池集中可能導致自私行為,從而對系統吞吐量構成威脅。另一個有希望的解決方案是開發防御機制,以對抗區塊鏈網絡內共識過程的數據威脅。此外,為了降低區塊鏈中的分叉概率,在[79]中采用了大偏差理論來分析有意分叉導致的區塊鏈網絡脆弱性,並提出防止分叉攻擊的戰略規划機制。在未來,有必要將計算能力和攻擊檢測延遲等資源使用因素納入分叉分析。此外,智能合約還可以集成到miner網絡中,對來自分布式節點的模型更新執行可靠的身份驗證。通過使用自執行契約,驗證所有模型更新信息以評估消息的正確性,並驗證用戶標識以檢測可能的虛假更新。

9.2 FLchain中的通信和異質性問題

另一個挑戰是通信和區塊鏈的延遲與錯誤對FL訓練績效的影響。事實上,由於不平衡和NonIID數據,上行鏈路和下行鏈路中FL訓練中的通信都是高度敏感的,因為每個客戶端的本地訓練數據由於不同的感知環境而在大小和分布上是不同的。此外,當客戶機的數量呈指數增長時,由於網絡中的流量擁塞增加,大量客戶機與服務器之間用於參數更新的直接通信在網絡頻道中成為瓶頸。這可能會導致通信過程中的高延遲和更高的數據丟失概率,從而導致FL訓練收斂速度緩慢且不准確。在FL訓練中緩解網絡流量的一個可能解決方案是使用壓縮方法[83],以減少通信輪中每個客戶端的模型更新大小。然而,這種壓縮方法通常會增加訓練目標的誤差下限,因為它們會增加模型更新的方差。因此,有必要選擇適當數量的量化級別以達到最佳的錯誤通信權衡。從區塊鏈方面來看,共識期間區塊挖掘造成的延遲和更新偏差也可能會降低FL訓練的性能。

由於不同物聯網設備的異構訓練能力,FLchain系統中FL算法的收斂性並不總是得到保證。事實上,不同物聯網設備的特性是不同的,從硬件(CPU、內存)、網絡協議(如4G/5G和WiFi)到電池,所有這些都導致物聯網設備計算和通信的異構性,並直接影響單設備AI模型的訓練時間和學習質量[85]。例如,計算能力有限且連接不良的設備可能需要更長的時間才能完成對服務器的本地訓練和模型更新,這可能導致全局聚合的嚴重延遲。因此,直接應用現有的FL協議而不考慮此類異構設備屬性會使整個訓練過程效率低下。

已經提出了幾種解決FLchain性能相關的方案。[31]中的研究提出了一種新的高效通信協議,該協議能夠壓縮上行鏈路和下行鏈路通信,同時對增加的客戶端數量和數據分布保持高度魯棒性。這些特性可以通過組合使用稀疏化、三元化、錯誤積累和優化Golomb編碼技術來實現,用於上行鏈路壓縮,並在不影響學習收斂的情況下加速全局服務器中的並行訓練。此外,在[86]中,針對基於FL的物聯網網絡提出了一種新的優化算法,稱為FetchSGD,該算法可以訓練通信效率的高質量模型。在每一輪通信中,客戶機根據其本地數據計算梯度,然后使用稱為計數草圖的數據結構壓縮梯度,然后將其發送到中央服務器。服務器維護模型誤差,並從誤差中提取每輪應用的權重更新。通過這種方式,減少了每輪所需的通信量,同時仍然符合聯邦設置的訓練質量要求。

此外,設計輕量級共識機制來緩解塊挖掘延遲是為了提高整體FLchain訓練速度,這可以通過實施輕量級塊驗證方案來實現[39]。最重要的數據(如本地客戶端更新)可以優先添加到塊中,以便在FLchain更新聚合中獲得客戶端之間的一致意見,而簽名分配和區塊驗證可以根據每個客戶端的信譽進行簡化。例如,由於頻繁更新訓練貢獻而享有較高聲譽的客戶可以在驗證階段獲得更高的優先級,以進行快速區塊批准,這有助於減少模型聚合中的延遲和偏差,進而提高整體訓練績效。此外,為了解決FL訓練中的異構問題,[87]中的工作在異構環境中提出了一個FL框架,其中設備客戶端可能由於其行為而表現異常,並且不同設備上的數據點具有不同的分布。設計了一個模塊化算法,包括計算經驗風險最小化、計算孤立點聚類算法和在每個簇上實現分布式優化三個步驟,旨在解決每個網絡組中不同設備的異構行為所帶來的高維問題。

9.3 FLchain中的激勵問題

在實際的FLchain系統中,當移動用戶既是訓練節點又是礦工時,如何鼓勵用戶加入FLchain過程是一個關鍵挑戰。如果用戶沒有多少經濟效益來補償計算和存儲資源的消耗,則用戶可能不願意將其資源用於執行挖掘。在沒有任何服務器(如MEC服務器)來協調FLchain流程和管理區塊鏈挖掘的無服務器場景中,此問題尤為重要。此外,設備的不同特性(如CPU和內存)導致的FLchain節點之間的異質性也會導致節點之間的不平衡。因此,具有較好計算能力的客戶可以主導訓練和挖掘,以獲得更多的回報。因此,如何在FLchain的節點之間實現經濟公平是一個具有挑戰性的問題。

已經提出了一些解決FLchain中經濟問題的解決方案。例如,為了鼓勵更多用戶實施FL訓練和區塊鏈挖掘,非常需要開發平衡良好的激勵機制來提高經濟效益。[91]中的作者為區塊鏈中的PoW計算實施了一種新的基於聲譽的解決方案,在區塊鏈中,移動采礦者受到激勵進行誠實采礦。使用博弈論設計了一種基於聲譽的算法,鼓勵用戶加入挖掘過程,以獲得額外的利潤,並具有資源管理意識。[92]中的另一項工作提出了一種基於信用的激勵方法,該方法基於采礦過程中獎懲聲譽的收入支付函數。合作開采行為將得到獎勵,而具有潛在的非合作行為將從協商一致過程中受到懲罰。該解決方案有望解決當前FLchain網絡中的激勵問題,旨在吸引更多用戶加入挖掘過程,從而增強FLchain系統的魯棒性。然而,平衡良好的激勵機制會影響客戶端計算資源的優化。例如,客戶機可能為FL分配64%的CPU,為挖掘分配36%的CPU,以實現利潤最大化。這種最優分配因激勵機制的不同而不同,從而導致AI模型質量和學習延遲的不同結果。

9.4 FLchain中的剽竊問題

FLchain中的另一個獨特挑戰是塊驗證過程中的剽竊問題,在這種情況下,懶惰節點可能在沒有實際訓練的情況下剽竊其他客戶機的ML模型。因此,懶惰節點可以為挖掘分配更多的計算資源以獲得更多的回報。這一問題不僅造成學習客戶之間的不公平,而且顯著降低了訓練的整體績效。如果沒有有效的解決方案,更多的客戶將拒絕參與訓練過程,這將降低FLchain系統的性能。

在FLchain中解決剽竊問題的方向包括使用加密技術和激勵機制。例如,[94]中提出了一種輕量級認證加密方案,提供可靠的數據加密,同時為硬件受限的物聯網設備節省通信帶寬和內存資源。[92]中的另一個解決方案使用激勵機制,對懶惰節點應用懲罰策略,從其他客戶機復制訓練參數,而不執行本地學習,同時對誠實節點的訓練工作給予獎勵。該解決方案有可能防止FLchain中的剽竊問題,並鼓勵更多客戶加入FL流程,以提高訓練績效。

9.5 MEC系統的低延遲要求

在MEC系統中實施FLchain必須滿足客戶服務的低延遲要求,如基於邊緣的自動駕駛或實時醫療分析。FL可以通過優化訓練減少通信延遲,而無需卸載原始數據,但它仍然會因重復通信循環而引入另一個延遲問題,這限制了FL流程的收斂速度。此外,區塊鏈的使用還帶來了區塊挖掘帶來的額外延遲,這給FL系統帶來了新的挑戰,因為FL客戶端需要等待挖掘過程完成,然后才能接收模型更新並執行下一輪訓練。

因此,在邊緣計算的FLchain實現中,需要采取一些方向來最小化延遲。例如,在[95]中提出了一種FL架構,通過以一種方式執行資源分配來加速FL訓練的收斂速度,應將更多資源分配給信道條件更差或計算能力較弱的設備。通過這種方式,設備可以實現AI訓練能力的平衡,從而提高低延遲FL訓練的模型聚合率。此外,輕量級挖掘設計應重點關注,通過降低事務制定和區塊驗證階段的復雜性,同時保持安全性和可伸縮性。此外,為了優化FLchain訓練中模型數據卸載引起的無線通信延遲,DRL等AI技術對於構建延遲控制策略非常有用。例如,[97]中提供的基於DRL的方法可以幫助客戶端設備了解關於更新大小、傳輸功率和區塊鏈交易狀態的最佳上傳規則,目的是在確保用戶隱私的同時最小化通信延遲。[98]中還提出了另一種基於DRL的方法,用於調度子信道分配和傳輸功率控制,以提高無線數據傳輸速率。在這種情況下,在多代理設置中,移動設備協作以基於本地觀察信息優化傳輸延遲,所有設備的可靠性和低延遲性都被考慮在內。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM