...
在縱向聯邦學習聯合建模過程中,兩家公司用戶群體不可能完全重疊,第一步需要找到相同的用戶ID集合。在不泄露數據前提下,找到雙方公共ID集合的技術稱為私有集交集 Private Set Intersection, PSI 。下面介紹一下基於散列和RSA算法的實現方案。 假設: 公司A的集合是UA u ,u ,u ,u 公司B的集合是UB u ,u ,u ,u 步驟 :公司B通過RSA算法生成公鑰對 ...
2021-08-09 11:27 0 190 推薦指數:
...
聯邦學習大火,主要是解決數據孤島問題,即如何在符合數據隱私的基礎上,實現多方數據不出本地,但是卻能聯合訓練一個共有大模型的目的,對於需要中心的縱向聯邦學習,是需要中心先下發公鑰,而后期會出現中心能夠完全掌握整個模型的情況。那么在更嚴格情況,AB都互不信任,C放在哪都不合適。 1 准備部分 ...
1 混合分布(Mixture Distribution)划分算法 我們在博文《聯邦學習:按病態獨立同分布划分Non-IID樣本》中學習了聯邦學習開山論文[1]中按照病態獨立同分布(Pathological Non-IID)划分樣本。 在上一篇博文《聯邦學習:按Dirichlet分布划分 ...
散列的構成:散列函數,散列表的存儲方式,散列表的沖突解決方法。 1.散列函數 較常用的散列函數有除留余數法,數字分析法,平方取中法,折疊法。 2.散列表的存儲方式 閉散列法(開地址法),用數組存儲;開散列法(鏈地址法),用鄰接鏈表存儲。 3.散列表的沖突解決方法 主要是針對 ...
1 導引 我們在《Python中的隨機采樣和概率分布(二)》介紹了如何用Python現有的庫對一個概率分布進行采樣,其中的Dirichlet分布大家一定不會感到陌生,這篇博客我們來更詳細地介紹Dirichlet分布的性質及其在聯邦學習領域的應用。 2 Dirichlet分布及其性質 ...
效果如圖: 小程序wxml: <view class='wraper'> <view class="header"> 頭部 </v ...
直接調用HashKit.sha1(String str)方法就可以了,,返回的是16進制的字符串長度是40, 也就是用md.digest()方法解析出來的字節數是160字節長度。 而MD5散列算法生成的字節數是128字節長度,返回的16進制的字符長度是32位 ...
hashmap的擴容因子是0.75 原因 參考:HashMap默認加載因子為什么選擇0.75?(阿里) 1. HashMap概述 HashMap是基於哈希表的Map接口的非同步實現。此實現提供所有可選的映射操作,並允許使用null值和null鍵。此類不保證映射的順序,特別是它不 ...