郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! 以下是对本文关键部分的摘抄翻译,详情请参见原文。 NeurIPS 2019 Workshop on Federated Learning for Data Privacy and Confidentiality, Vancouver ...
阅读论文 Optimizing Federated Learning on Non IID Data with Reinforcement Learning 的笔记 如有侵权,请联系作者,将会撤销发布。 主要讲什么 提出FAVOR,一个经验驱动控制的框架。 智能的选择客户端设备来参与联邦学习中每一轮训练,以抵消数据非独立同分布带啊来的偏差,并提升收敛的速度。 使用了deep Q learning ...
2020-09-10 23:40 0 866 推荐指数:
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! 以下是对本文关键部分的摘抄翻译,详情请参见原文。 NeurIPS 2019 Workshop on Federated Learning for Data Privacy and Confidentiality, Vancouver ...
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! arXiv:1907.02189v2 [stat.ML] 8 Oct 2019 Abstract 联邦学习使得大量的边 ...
https://www.bilibili.com/video/av9770302/?p=24 https://www.bilibili.com/video/av24724071/?p=3 http ...
A survey on federated learning Authors Chen Zhang, Yu Xie, Hang Bai, Bin Yu, Weihong Li, Yuan Gao Keywords ...
该文章是针对Hado van Hasselt于2010年提出的Double Q-learning算法的进一步拓展,是结合了DQN网络后,提出的关于DQN的Double Q-learning算法。该算法主要目的是修正DQN中max项所产生的过高估计问题,所谓过高估计,在前面的博客Issues ...
Deep Reinforcement Learning with Double Q-learning Google DeepMind Abstract 主流的 Q-learning 算法过高的估计在特定条件下的动作值。实际上,之前是不知道是否这样的过高估计是 common ...
背景 设备中有很多数据,可以用来训练模型提高用户体验。但是数据通常是敏感或者庞大的。 隐私问题 数据孤岛:每个公司都有数据,淘宝有你的购买记录,银行有你的资金状况,它们 ...
本文提出了联邦匹配平均(FedMA)算法。FedMA通过对提取到的具有相似特征的隐元素(即卷积层的通道,LSTM的隐状态,全连接层的神经元)进行匹配和平均,按层构建共享全局模型。FedMA训练的CNN ...