鄭重聲明:原文參見標題,如有侵權,請聯系作者,將會撤銷發布! 以下是對本文關鍵部分的摘抄翻譯,詳情請參見原文。 NeurIPS 2019 Workshop on Federated Learning for Data Privacy and Confidentiality, Vancouver ...
閱讀論文 Optimizing Federated Learning on Non IID Data with Reinforcement Learning 的筆記 如有侵權,請聯系作者,將會撤銷發布。 主要講什么 提出FAVOR,一個經驗驅動控制的框架。 智能的選擇客戶端設備來參與聯邦學習中每一輪訓練,以抵消數據非獨立同分布帶啊來的偏差,並提升收斂的速度。 使用了deep Q learning ...
2020-09-10 23:40 0 866 推薦指數:
鄭重聲明:原文參見標題,如有侵權,請聯系作者,將會撤銷發布! 以下是對本文關鍵部分的摘抄翻譯,詳情請參見原文。 NeurIPS 2019 Workshop on Federated Learning for Data Privacy and Confidentiality, Vancouver ...
鄭重聲明:原文參見標題,如有侵權,請聯系作者,將會撤銷發布! arXiv:1907.02189v2 [stat.ML] 8 Oct 2019 Abstract 聯邦學習使得大量的邊 ...
https://www.bilibili.com/video/av9770302/?p=24 https://www.bilibili.com/video/av24724071/?p=3 http ...
A survey on federated learning Authors Chen Zhang, Yu Xie, Hang Bai, Bin Yu, Weihong Li, Yuan Gao Keywords ...
該文章是針對Hado van Hasselt於2010年提出的Double Q-learning算法的進一步拓展,是結合了DQN網絡后,提出的關於DQN的Double Q-learning算法。該算法主要目的是修正DQN中max項所產生的過高估計問題,所謂過高估計,在前面的博客Issues ...
Deep Reinforcement Learning with Double Q-learning Google DeepMind Abstract 主流的 Q-learning 算法過高的估計在特定條件下的動作值。實際上,之前是不知道是否這樣的過高估計是 common ...
背景 設備中有很多數據,可以用來訓練模型提高用戶體驗。但是數據通常是敏感或者龐大的。 隱私問題 數據孤島:每個公司都有數據,淘寶有你的購買記錄,銀行有你的資金狀況,它們 ...
本文提出了聯邦匹配平均(FedMA)算法。FedMA通過對提取到的具有相似特征的隱元素(即卷積層的通道,LSTM的隱狀態,全連接層的神經元)進行匹配和平均,按層構建共享全局模型。FedMA訓練的CNN ...