一、區塊鏈是什么
1、區塊鏈技術簡介
區塊鏈憑借其匿名、不可篡改、分布式等特征,在多個不可信的參與方之間, 提供了一種安全可靠的解決方案。區塊鏈的本質是一種分布式賬本,其最大的特征,是由傳統的中心化方案變為分布式網絡結構,通過非對稱加密等密碼學技術確保鏈上數據的安全;同時,通過共識機制、智能合約等,在多個不可信的分布式參與方之間,保證鏈數據的可靠性。
區塊鏈技術特性:
(1)身份管理:區塊鏈通過哈希地址以及權限認證等,實現對參與節點的安全管理;
(2)分布式賬本:通過點對點傳輸、哈希算法、數字簽名技術(密碼算法)、共識機制從結構上保證各節點數據一致性。
(3)數據記錄:借助非對稱加密(如橢圓曲線)、哈希算法等技術,區塊鏈上的數據具有透明、可追溯、防篡改等特性;
(4)激勵機制:區塊鏈通過激勵機制,如數字貨幣,確保參與方共同維持區塊鏈的運轉;
(5)共識機制:共識機制是區塊鏈在分布式節點間保證數據安全可靠的關鍵。通過共識機制,各個參與方對數據進行認證,可以有效降低數據被篡改的風險,確保鏈上數據的一致性。
區塊鏈適用場景:
(1)存在去中心化、多方參與和寫入數據的需求;
(2)對數據真實性要求高的場景;
(3)初始情況下相互不信任的多個參與者建立分布式信任的需求;
2、區塊鏈技術面臨的挑戰
(1)計算和認證的效率問題
為了保障區塊鏈這個分布式網絡中各個參與方的數據一致性、數據安全性,通常采用數據簽名、共識機制等技術實現,這些技術實現的計算開銷影響了區塊生成的效率,進而影響交易數據上鏈認證的效率。
(2) 智能合約的不完美性
智能合約的優點在於交易事務的自動化執行,不需要人為參與,只要滿足智能合約代碼所列出的要求即可,去除任何第三方干擾,進一步增強了網絡的去中心化,會節省時間,降低成本,交易更准確,且無法更改。其缺點在於合約制定時有缺陷、完全實施有困難、是否符合法律法規。智能合約的“智能”需要進一步加強。
二、機器學習現狀
1、傳統機器學習
傳統的機器學習算法依賴於一個中心化服務器上的數據集來訓練模型,通常數據集越大,所訓練的模型越准確。可能有如下問題:
(1)服務器需要從多個組織或機構收集數據,增加了用戶數據隱私泄露的風險;
(2)如何獲取更多的用戶數據來訓練更為精確的模型。
2、聯邦學習
聯邦學習(federatedlearning)是一種新興的人工智能基礎技術,其設計目標是在保障大數據交換時的信息安全、保護終端數據和個人數據隱私、保證合法合規的前提下,在多參與方或多計算結點之間開展高效率的機器學習。在大多數行業中,數據是以孤島的形式存在的,由於行業競爭、隱私安全、行政手續復雜等問題,即使是在同一個公司的不同部門之間實現數據整合也面臨着重重阻力,通過聯邦學習,在模型訓練和推理的過程中對交互數據進行加密運算,一定程度上實現了高效、准確的共同使用各自的數據。聯邦學習通過迭代訓練運算方式實現“數據可用不可見”、“數據不出門”,解決傳統機器學習中心化依賴、數據隱私保護的問題,同時可引入更多組織或機構的數據加入,整體上提升模型質量。
3、聯邦學習面臨的挑戰
(1)多個參與方互信問題
由於聯邦學習的數據來自不同的組織或機構,彼此間缺乏信任,需要在多方不信任的基礎上協作運算。
(2)安全風險
參與方提供的數據質量問題,數據背書問題,都可能影響整個機器學習任務模型的質量,進而影響聯邦學習的結果保證。
(3)通信鏈路的可靠性
多方學習的數據在傳輸過程中被攻擊或篡改都會影響最終聯邦學習的結果。
三、區塊鏈賦能聯邦學習
聯邦學習和區塊鏈都是需要多方參與實現的,通過技術上的共識實現多方合作的可信網絡,具有較好的互補性。從應用目標來看,聯邦學習旨在創造價值,而區塊鏈旨在表示和轉移價值。區塊鏈可從以下四個方面賦能聯邦學習:
(1)區塊鏈提供可信身份認證機制
通過區塊鏈的授權機制、身份管理等,可以將互不可信的用戶作為參與方整合到一起,建立一個安全可信的合作機制。
(2)區塊鏈提供可信存儲機制
聯邦學習的模型參數可以存儲在區塊鏈中,保證了模型參數的安全性與可靠性。
(3)區塊鏈提供數據安全共享機制
通過區塊鏈的分布式賬本特性,天然保證了聯邦學習中多個參與方之間的模型參數數據一致性、模型參數數據同步與共享是安全的、可信的,保證交互的模型參數數據透明、可追溯、防篡改防偽造。
(4)區塊鏈提供可信的貢獻激勵評估機制
聯邦學習過程中,越多的參與方加入,越能體現數據結果的准確性。在模型訓練完成后,根據本次訓練過程中各參與者提供的訓練數據的數量和質量發放獎勵資源,並將獎勵資源寫入區塊鏈中,利用區塊鏈的公開透明特性,引入更多的參與方加入、同時提升參與方的配合程度。
四、處理流程
五、需要解決的問題
(1)區塊鏈的性能問題
區塊鏈“貴”在信任,“慢”得其所的思維限制了很多業務場景的使用,而提升性能的關鍵就是共識算法,而通用的共識算法,如PoW,BFT等都不一定能滿足業務應用的需求,而結合業務的特點,通過研發優化或更換新的共識機制解決滿足聯邦學習的性能需求有一定的必要性,比如:通過各節點的模型參數准確率來作為共識算法的依據,多數參與方都在一個范圍內就達成共識(需詳細研究)。
(2)落地的難度
聯邦學習和區塊鏈都是需要多方參與才能完成的事情,需要在落地實施前考慮到多個參與方的協作意願和共識,不然一切都是紙上談兵。