原文:Optimizing Federated Learning on Non-IID Data with Reinforcement Learning 笔记

阅读论文 Optimizing Federated Learning on Non IID Data with Reinforcement Learning 的笔记 如有侵权,请联系作者,将会撤销发布。 主要讲什么 提出FAVOR,一个经验驱动控制的框架。 智能的选择客户端设备来参与联邦学习中每一轮训练,以抵消数据非独立同分布带啊来的偏差,并提升收敛的速度。 使用了deep Q learning ...

2020-09-10 23:40 0 866 推荐指数:

查看详情

Overcoming Forgetting in Federated Learning on Non-IID Data

郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! 以下是对本文关键部分的摘抄翻译,详情请参见原文。 NeurIPS 2019 Workshop on Federated Learning for Data Privacy and Confidentiality, Vancouver ...

Fri Nov 08 03:05:00 CST 2019 0 346
On the Convergence of FedAvg on Non-IID Data

郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! arXiv:1907.02189v2 [stat.ML] 8 Oct 2019 Abstract   联邦学习使得大量的边 ...

Sun Nov 17 19:59:00 CST 2019 0 839
Reinforcement Learning

https://www.bilibili.com/video/av9770302/?p=24 https://www.bilibili.com/video/av24724071/?p=3 http ...

Wed Aug 22 00:34:00 CST 2018 0 7245
文献笔记:Deep Reinforcement Learning with Double Q-learning

该文章是针对Hado van Hasselt于2010年提出的Double Q-learning算法的进一步拓展,是结合了DQN网络后,提出的关于DQN的Double Q-learning算法。该算法主要目的是修正DQN中max项所产生的过高估计问题,所谓过高估计,在前面的博客Issues ...

Tue Mar 12 03:34:00 CST 2019 0 701
论文笔记之:Deep Reinforcement Learning with Double Q-learning

Deep Reinforcement Learning with Double Q-learning Google DeepMind   Abstract   主流的 Q-learning 算法过高的估计在特定条件下的动作值。实际上,之前是不知道是否这样的过高估计是 common ...

Mon Jun 27 23:39:00 CST 2016 0 5332
初识 Federated Learning

背景 设备中有很多数据,可以用来训练模型提高用户体验。但是数据通常是敏感或者庞大的。 隐私问题 数据孤岛:每个公司都有数据,淘宝有你的购买记录,银行有你的资金状况,它们 ...

Mon Jun 15 20:53:00 CST 2020 0 966
Federated Learning with Matched Averaging

本文提出了联邦匹配平均(FedMA)算法。FedMA通过对提取到的具有相似特征的隐元素(即卷积层的通道,LSTM的隐状态,全连接层的神经元)进行匹配和平均,按层构建共享全局模型。FedMA训练的CNN ...

Fri Aug 14 00:50:00 CST 2020 0 459
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM