最佳閱讀體驗請前往原文地址: 變分自編碼器(Variational Autoencoder, VAE)通俗教程—— 作者:鄧范鑫
1. 神秘變量與數據集
現在有一個數據集DX(dataset, 也可以叫datapoints),每個數據也稱為數據點。
X是一個實際的樣本集合,我們假定這個樣本受某種神秘力量操控,但是我們也無從知道這些神秘力量是什么?那么我們假定這股神秘力量有n個,起名字叫power1,power2,…,powern吧,他們的大小分別是z1,z2,…,zn,稱之為神秘變量表示成一個向量就是
z也起個名字叫神秘組合。
一言以蔽之:神秘變量代表了神秘力量的神秘組合關系。
用正經的話說就是:隱變量(latent variable)代表了隱因子(latent factor)的組合關系。
這里我們澄清一下隸屬空間,假設數據集DX是m個點,這m個點也應該隸屬於一個空間,比如一維的情況,假如每個點是一個實數,那么他的隸屬空間就是實數集,所以我們這里定義一個DX每個點都屬於的空間稱為XS,我們在后面提到的時候,你就不再感到陌生了。
神秘變量z可以肯定他們也有一個歸屬空間稱為ZS。
下面我們就要形式化地構造X與Z的神秘關系了,這個關系就是我們前面說的神秘力量,直觀上我們已經非常清楚,假設我們的數據集就是完全由這n個神秘變量全權操控的,那么對於X中每一個點都應該有一個n個神秘變量的神秘組合zj來神秘決定。