...
在纵向联邦学习联合建模过程中,两家公司用户群体不可能完全重叠,第一步需要找到相同的用户ID集合。在不泄露数据前提下,找到双方公共ID集合的技术称为私有集交集 Private Set Intersection, PSI 。下面介绍一下基于散列和RSA算法的实现方案。 假设: 公司A的集合是UA u ,u ,u ,u 公司B的集合是UB u ,u ,u ,u 步骤 :公司B通过RSA算法生成公钥对 ...
2021-08-09 11:27 0 190 推荐指数:
...
联邦学习大火,主要是解决数据孤岛问题,即如何在符合数据隐私的基础上,实现多方数据不出本地,但是却能联合训练一个共有大模型的目的,对于需要中心的纵向联邦学习,是需要中心先下发公钥,而后期会出现中心能够完全掌握整个模型的情况。那么在更严格情况,AB都互不信任,C放在哪都不合适。 1 准备部分 ...
1 混合分布(Mixture Distribution)划分算法 我们在博文《联邦学习:按病态独立同分布划分Non-IID样本》中学习了联邦学习开山论文[1]中按照病态独立同分布(Pathological Non-IID)划分样本。 在上一篇博文《联邦学习:按Dirichlet分布划分 ...
散列的构成:散列函数,散列表的存储方式,散列表的冲突解决方法。 1.散列函数 较常用的散列函数有除留余数法,数字分析法,平方取中法,折叠法。 2.散列表的存储方式 闭散列法(开地址法),用数组存储;开散列法(链地址法),用邻接链表存储。 3.散列表的冲突解决方法 主要是针对 ...
1 导引 我们在《Python中的随机采样和概率分布(二)》介绍了如何用Python现有的库对一个概率分布进行采样,其中的Dirichlet分布大家一定不会感到陌生,这篇博客我们来更详细地介绍Dirichlet分布的性质及其在联邦学习领域的应用。 2 Dirichlet分布及其性质 ...
效果如图: 小程序wxml: <view class='wraper'> <view class="header"> 头部 </v ...
直接调用HashKit.sha1(String str)方法就可以了,,返回的是16进制的字符串长度是40, 也就是用md.digest()方法解析出来的字节数是160字节长度。 而MD5散列算法生成的字节数是128字节长度,返回的16进制的字符长度是32位 ...
hashmap的扩容因子是0.75 原因 参考:HashMap默认加载因子为什么选择0.75?(阿里) 1. HashMap概述 HashMap是基于哈希表的Map接口的非同步实现。此实现提供所有可选的映射操作,并允许使用null值和null键。此类不保证映射的顺序,特别是它不 ...