【文章推薦】Optimizing Federated Learning on Non-IID Data with Reinforcement Learning 筆記

原文：Optimizing Federated Learning on Non-IID Data with Reinforcement Learning 筆記

閱讀論文 Optimizing Federated Learning on Non IID Data with Reinforcement Learning 的筆記如有侵權，請聯系作者，將會撤銷發布。主要講什么提出FAVOR，一個經驗驅動控制的框架。智能的選擇客戶端設備來參與聯邦學習中每一輪訓練，以抵消數據非獨立同分布帶啊來的偏差，並提升收斂的速度。使用了deep Q learning ...

2020-09-10 23:40 0 866 推薦指數：

查看詳情

Overcoming Forgetting in Federated Learning on Non-IID Data

鄭重聲明：原文參見標題，如有侵權，請聯系作者，將會撤銷發布！以下是對本文關鍵部分的摘抄翻譯，詳情請參見原文。 NeurIPS 2019 Workshop on Federated Learning for Data Privacy and Confidentiality, Vancouver ...

On the Convergence of FedAvg on Non-IID Data

鄭重聲明：原文參見標題，如有侵權，請聯系作者，將會撤銷發布！ arXiv:1907.02189v2 [stat.ML] 8 Oct 2019 Abstract 　　聯邦學習使得大量的邊 ...

Reinforcement Learning

https://www.bilibili.com/video/av9770302/?p=24 https://www.bilibili.com/video/av24724071/?p=3 http ...

【論文筆記】A survey on federated learning（綜述）

A survey on federated learning Authors Chen Zhang, Yu Xie, Hang Bai, Bin Yu, Weihong Li, Yuan Gao Keywords ...

文獻筆記:Deep Reinforcement Learning with Double Q-learning

該文章是針對Hado van Hasselt於2010年提出的Double Q-learning算法的進一步拓展，是結合了DQN網絡后，提出的關於DQN的Double Q-learning算法。該算法主要目的是修正DQN中max項所產生的過高估計問題，所謂過高估計，在前面的博客Issues ...

論文筆記之：Deep Reinforcement Learning with Double Q-learning

Deep Reinforcement Learning with Double Q-learning Google DeepMind 　　Abstract 　　主流的 Q-learning 算法過高的估計在特定條件下的動作值。實際上，之前是不知道是否這樣的過高估計是 common ...

初識 Federated Learning

背景設備中有很多數據，可以用來訓練模型提高用戶體驗。但是數據通常是敏感或者龐大的。隱私問題數據孤島：每個公司都有數據，淘寶有你的購買記錄，銀行有你的資金狀況，它們 ...

Federated Learning with Matched Averaging

本文提出了聯邦匹配平均（FedMA）算法。FedMA通過對提取到的具有相似特征的隱元素（即卷積層的通道，LSTM的隱狀態，全連接層的神經元）進行匹配和平均，按層構建共享全局模型。FedMA訓練的CNN ...

原文：Optimizing Federated Learning on Non-IID Data with Reinforcement Learning 筆記

相關推薦

相關標簽