半監督學習 什么是半監督學習? 大家知道在監督學習里,有一大堆的訓練數據(由input和output對組成)。例如上圖所示\(x^r\)是一張圖片,\(y^r\)是類別的label。 半監督學習是說,在label數據上面,有另外一組unlabeled的數據,寫成\(x^u ...
把無監督學習分成兩種 一種是化繁為簡,可以分成兩大類:聚類和降維 所謂的化繁為簡的意思是說,找一個函數,可以input看起來像樹的東西,output都是抽象的樹,把本來復雜的東西,變成比較簡單的output。在做無監督學習時,通常只會有函數中的一邊。比如找一個函數,可以把所有的樹都變成抽象的樹,但是擁有的數據,只有一大堆各種不同的圖像,不知道它的output長什么樣子。 另外一種是無中生有,找一 ...
2020-06-20 22:11 0 1428 推薦指數:
半監督學習 什么是半監督學習? 大家知道在監督學習里,有一大堆的訓練數據(由input和output對組成)。例如上圖所示\(x^r\)是一張圖片,\(y^r\)是類別的label。 半監督學習是說,在label數據上面,有另外一組unlabeled的數據,寫成\(x^u ...
Manifold Learning t-SNE的“N E”就是Neighbor Embedding的縮寫。現在要做的事情就是之前講過的降維,只不過是非線性的降維。 我們知道數據點可能是高維空間里的一個流形曲面,也可以說,數據點的分布其實是在一個低維的空間里面,只是被扭曲塞到了一個高維空間 ...
1-of-N encoding 詞嵌入其實是降維的一種非常好,非常廣為人知的應用。 如果要用一個向量表示一個詞,最典型的做法是1-of-N encoding。每一個詞用一個向量表示,向量的維度就是所有可能的詞的數量,假如有10萬個,那1-of-N encoding的維度就是十萬維。每一個 ...
什么是Auto-encoder 我們首先去找一個encoder,input一個東西,比如圖像識別做MNIST的話,就是input一張手寫數字圖片(28 *28 維像素點),那就是input 78 ...
為什么要降維? 維數少可以使算法有更快的計算速度,減少機器內存占用等 多個特征攜帶的“信息”有相同或類似的情況(冗余) 用於數據可視化 如何降維? 簡單的例子,對於二位數據 可以找到一條線 將所有的數據映射到這條線上 然后用映射后的一維數據去代表二位數 ...
PCA算法及其應用 1.主成分分析(PCA) 1.主成分分析(Principal Component Analysis,PCA) 是最常用的一種降維方法,通常用於高維數據集的探索與可視化,還可以用做數據壓縮和預處理等。2.PCA可以把具有相關性的高維變量合成為線性無關的低維變量,稱為主成分 ...
一:降維之數據壓縮 將討論第二種無監督學習的問題:降維。數據壓縮不僅能讓我們對數據進行壓縮,使得數據占用較少的內存和硬盤空間,還能對學習算法進行加速。 (一)降維是什么(二維降至一維) 假使我們要采用兩種不同的儀器來測量一些東西的尺寸,其中一個儀器測量結果的單位是英寸,另一個儀器測量的結果是 ...
問題:越深越好? 層數越多,參數越多,model比較復雜,數據又多的話,本來誤差就越小,這為什么歸因於”深“呢? 矮胖結構 v.s. 高瘦結構 真正要比較”深“和”淺“的model的時候 ...