區塊鏈是一種分布式的數據庫,通過利用加密算法、共識機制等技術構造的信任機制,使其存儲的數據安全可靠且防篡改。聯邦學習不僅保護了數據隱私的安全,還利用這些數據在可信、安全的環境下構建了機器學習模型。聯邦學習和區塊鏈的相同點主要如下。
- 分布式結構,每個參與方在其中一個節點中進行數據操作,不同節點之間相互獨立。
- 強調參與節點的地位對等
- 不管是聯邦學習還是區塊鏈,通過明文數據進行運算或交易,都存在數據隱私泄露的風險。因此,在聯邦學習和區塊鏈場景中,數據的操作都需要與密碼學的安全機制,例如同態加密、安全多方、零知識證明等技術相結合,以保護用戶的數據隱私。
聯邦學習和區塊鏈的本質並不相同,主要體現在:
(1)本質不同
聯邦學習的核心是數據不能被移動或復制到其他節點上,每個節點都不知道其他節點的數據。
區塊鏈則相反,為了保證數據的一致性,形成多方共識,需要把數據復制到不同節點上,形成統一賬本,所有節點都保留一份相同的賬本數據。
(2)所屬范疇不同
區塊鏈是一個分布式賬本,屬於數據結構的范疇;
聯邦學習是一種分布式的機器學習模型訓練方法,屬於機器學習范疇
(3)解決的問題不同
聯邦學習要解決小數據、數據割裂、數據孤島而形成的訓練樣本數量不足、質量低的問題,在保護數據隱私安全的前提下聯合各參與方構建高質量的機器學習模型;
區塊鏈的目標是希望構建一個去中心化、防篡改、公開透明的可信計算平台。
當然,區塊鏈可以與聯邦學習優勢互補、強強聯合。
(1)區塊鏈賦能聯邦學習激勵機制
為推動聯邦學習成為一種可持續的發展模式,必須要激勵數據持有者分享其數據集,對模型貢獻大的參與方進行激勵,從而保證聯邦學習的良性生態且可持續發展。
而要激勵參與者需要評估每個參與者的貢獻
(2)區塊鏈實現聯邦學習利益的自動分配
借助區塊鏈的共識機制和智能合約,可以利用激勵機制計算得到的收益,並自動分配給各參與方。
(3)區塊鏈提升聯邦學習防御能力
利用區塊鏈記錄不可篡改的特點,提升聯邦學習防御能力。由於聯邦學習當前面臨的一個問題是對抗攻擊問題,例如本地數據的篡改,模型參數的篡改等,都會導致模型性能的下降。而當前的方案,如通過異常檢測等發現異常的數據或客戶端,均很難有效解決這個問題。
結合區塊鏈的不可篡改性,可以將每個參與方的數據和模型參數都存儲在區塊鏈中。這樣,只要有一方的數據或參數被篡改,其信息會被判定為無效
(4)區塊鏈幫助追蹤聯邦學習的攻擊來源
區塊鏈可以幫助聯邦學習識別並低於潛在攻擊,還可以結合區塊鏈可追溯的特點,對發起惡意攻擊的參與方進行追溯和懲罰
