分布式計算、統計學習與ADMM算法

本文轉載自查看原文 2016-10-14 21:50 2868

在整理舊電腦時，才發現13年下半年電腦里有不少殘文。老師說，東西擱下了再拿起來花費的時間和之前可能差不多。我一眼看過去這篇關於分布式計算的文章，貌似還真的沒有了當時理解的深度和感覺。當時還想利用ADMM算法，把統計中常見的帶懲罰的高維問題在此框架下用R重寫一下，但是中途多種事情一耽擱，就早已拋之腦后。看來任何事情，真的還是需要堅持，哪怕撥點時間都是好的。先把一篇殘文扔出來祭奠下過去的13年吧。公式多文字長，慎入！

業界一直在談論大數據，對於統計而言，大數據其實意味着要不是樣本量增加

1. 優化的一些基本算法思想

ADMM算法並不是一個很新的算法，他只是整合許多不少經典優化思路，然后結合現代統計學習所遇到的問題，提出了一個比較一般的比較好實施的分布式計算框架。因此必須先要了解一些基本算法思想。

1.1 Dual Ascent

對於凸函數的優化問題，對偶上升法核心思想就是引入一個對偶變量，然后利用交替優化的思路，使得兩者同時達到optimal。一個凸函數的對偶函數其實就是原凸函數的一個下界，因此可以證明一個較好的性質：在強對偶性假設下，即最小化原凸函數（primal）等價於最大化對偶函數（dual），兩者會同時達到optimal。這種轉化可以將原來很多的參數約束條件變得少了很多，以利於做優化。具體表述如下：

min f (x)

s.t.A x = b ⟹ L (x, y) = f (x) + y T (A x - b) ⟹

在強對偶性的假設下，primal和dual問題同時達到最優。

x ⋆ = arg min L (x, y ⋆)

因此，若對偶函數

x k + 1 : y k + 1 : = arg min x L (x, y k)

當

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 淺談Java分布式計算分布式計算框架——Spark 分布式計算框架分布式計算框架綜述並行計算與分布式計算區別與聯系分布式計算技術之Stream流式計算並行計算與分布式計算玩轉mongodb（八）：分布式計算--MapReduce 2_分布式計算框架MapReduce 分布式計算環境復習要點