作者:桂。
時間:2017-04-06 20:26:01
鏈接:http://www.cnblogs.com/xingshansi/p/6670214.html
聲明:歡迎被轉載,不過記得注明出處哦~
前言
本文非負矩陣分解(Nonegative matrix factorization,NMF)系列第二篇,主要介紹最基本的NMF原理及代碼實現,內容主要包括:
1)基於Euclidean距離的NMF推導及實現;
2)基於KL散度的NMF推導及實現;
3)NMF應用示例
開始之前,有兩點需要補充:
- 前面分析用的是X=AS形式,感覺別扭,好多文章都是用V = WH,后續打算也采用這也表達方式;
- NMF其實是含有約束的優化問題,但乘法算法可以巧妙得讓我們只需討論:無約束優化問題。
一、基於Euclidean距離的NMF推導及實現
考慮無約束優化問題:
利用梯度下降:
其中:
如果直接梯度下降,對於無約束的優化問題,我們不能保證結果都是非負的,下面巧妙之處來了:將梯度下降法變為乘法算法。
令:
梯度下降法變換為乘法算法:
真是巧妙!一個復雜的約束性優化問題,就讓一個簡單的無約束給解決了。這樣一來,如果原矩陣為非負,W、H初始值同樣非負,結果自始至終都是非負,直至迭代到滿足收斂條件。
收斂性證明可以參考:Lee D D, Seung H S. Algorithms for Non-negative Matrix Factorization[C]// NIPS. 2000:556--562.
給出對應的代碼實現:
function [W, H] = nmf(V, K, MAXITER) %Euclidean distance F = size(V,1); T = size(V,2); rand('seed',0) W = 1+rand(F, K); % W = W./repmat(sum(W),F,1); H = 1+rand(K, T); ONES = ones(F,T); for i=1:MAXITER H = H .* (W'*V)./(W'*W*H+eps) ; W = W .* (V*H')./(W*H*H'+eps); end
其實關鍵的就是循環里的兩行。
二、基於KL散度的NMF推導及實現
整個思路與Euclidean distance下的求解思路如出一轍。
考慮無約束優化問題:
利用梯度下降算法:
其中:
根據梯度下降算法轉化為乘法算法:
令:
梯度下降算法改寫為乘法算法:
收斂性證明可以參考:Lee D D, Seung H S. Algorithms for Non-negative Matrix Factorization[C]// NIPS. 2000:556--562.
對應代碼:
function [W, H] = nmf(V, K, MAXITER) %KL-divergence F = size(V,1); T = size(V,2); rand('seed',0) W = 1+rand(F, K); % W = W./repmat(sum(W),F,1); H = 1+rand(K, T); ONES = ones(F,T); for i=1:MAXITER H = H .* (W'*( V./(W*H+eps))) ./ (W'*ONES); W = W .* ((V./(W*H+eps))*H') ./(ONES*H'); end
三、NMF應用示例
對於一個混合語音,如鼓點和管樂器混合的單通道聲音,可以利用非負矩陣進行分解,實現語音信號的分離。
思路:
語音的時頻分析,得到的語譜圖是一個二維數據矩陣,其中鼓點、管樂器的概率分布不同,利用NMF可以實現信號的分離。
對應代碼(NMF調用上面任何一個都可以):
% Read in audio file [x0 fs] = audioread('test_audio.wav'); x = x0(1:5*fs);%read 5s wav nw = 1024; ni = 256; X = fft(enframe(x,nw,ni)'); V = abs(X); % NMF K = 2; % number of basis vectors MAXITER = 200; % total number of iterations to run [W, H] = nmf(V, K, MAXITER); % get the mixture phase phi = angle(X); %Reconstruct X1 = W(:,1)*H(1,:); X2 = W(:,2)*H(2,:); s1 = zeros(1,length(x)); s2 = zeros(1,length(x)); for i = 1:size(X1,2) nic = (1+(i-1)*ni):(nw+(i-1)*ni); s1(1,nic) = s1(1,nic)+real(ifft(X1(:,i).*exp(1j*phi(:,i))))'; s2(1,nic) = s2(1,nic)+real(ifft(X2(:,i).*exp(1j*phi(:,i))))'; end s1 = s1/max(abs(s1)); s2 = s2/max(abs(s2));
可以看出這里K是給定的,即NMF實現分解需要給出先驗的類別數。這里給出語譜圖,圖片可以更加直觀地觀察分離效果,結果圖:
看看時域的分離效果:
分離效果還是不錯的。
參考:
- Lee D D, Seung H S. Algorithms for Non-negative Matrix Factorization[C]// NIPS. 2000:556--562.
- 張賢達:《矩陣分析與應用,第二版》.