原文:Optimizing Federated Learning on Non-IID Data with Reinforcement Learning 筆記

閱讀論文 Optimizing Federated Learning on Non IID Data with Reinforcement Learning 的筆記 如有侵權,請聯系作者,將會撤銷發布。 主要講什么 提出FAVOR,一個經驗驅動控制的框架。 智能的選擇客戶端設備來參與聯邦學習中每一輪訓練,以抵消數據非獨立同分布帶啊來的偏差,並提升收斂的速度。 使用了deep Q learning ...

2020-09-10 23:40 0 866 推薦指數:

查看詳情

Overcoming Forgetting in Federated Learning on Non-IID Data

鄭重聲明:原文參見標題,如有侵權,請聯系作者,將會撤銷發布! 以下是對本文關鍵部分的摘抄翻譯,詳情請參見原文。 NeurIPS 2019 Workshop on Federated Learning for Data Privacy and Confidentiality, Vancouver ...

Fri Nov 08 03:05:00 CST 2019 0 346
On the Convergence of FedAvg on Non-IID Data

鄭重聲明:原文參見標題,如有侵權,請聯系作者,將會撤銷發布! arXiv:1907.02189v2 [stat.ML] 8 Oct 2019 Abstract   聯邦學習使得大量的邊 ...

Sun Nov 17 19:59:00 CST 2019 0 839
Reinforcement Learning

https://www.bilibili.com/video/av9770302/?p=24 https://www.bilibili.com/video/av24724071/?p=3 http ...

Wed Aug 22 00:34:00 CST 2018 0 7245
文獻筆記:Deep Reinforcement Learning with Double Q-learning

該文章是針對Hado van Hasselt於2010年提出的Double Q-learning算法的進一步拓展,是結合了DQN網絡后,提出的關於DQN的Double Q-learning算法。該算法主要目的是修正DQN中max項所產生的過高估計問題,所謂過高估計,在前面的博客Issues ...

Tue Mar 12 03:34:00 CST 2019 0 701
論文筆記之:Deep Reinforcement Learning with Double Q-learning

Deep Reinforcement Learning with Double Q-learning Google DeepMind   Abstract   主流的 Q-learning 算法過高的估計在特定條件下的動作值。實際上,之前是不知道是否這樣的過高估計是 common ...

Mon Jun 27 23:39:00 CST 2016 0 5332
初識 Federated Learning

背景 設備中有很多數據,可以用來訓練模型提高用戶體驗。但是數據通常是敏感或者龐大的。 隱私問題 數據孤島:每個公司都有數據,淘寶有你的購買記錄,銀行有你的資金狀況,它們 ...

Mon Jun 15 20:53:00 CST 2020 0 966
Federated Learning with Matched Averaging

本文提出了聯邦匹配平均(FedMA)算法。FedMA通過對提取到的具有相似特征的隱元素(即卷積層的通道,LSTM的隱狀態,全連接層的神經元)進行匹配和平均,按層構建共享全局模型。FedMA訓練的CNN ...

Fri Aug 14 00:50:00 CST 2020 0 459
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM