前言:模式識別問題
模式函數是一個從問題定義域到模式值域的一個單射。
從簡單的貝葉斯方法,到只能支持二分類的原始支持向量機,到十幾個類的分類上最好用的隨機森林方法,到可以支持ImageNet上海量1860個類且分類精度極高的InceptionV4(參考:CNNhttp://blog.csdn.net/wishchin/article/details/45286805),其模式函數為
f( x ) = { X——>Y }|{ X = ImageNet的圖片,Y={ 1860個類的標記 } }
是一個單射函數。 普遍情況下,定義域小於值域,模式函數成為一個hash函數。
參考: AI:模式識別的數學表示(集合—函數觀點)
生成式模型GAN:
機器之心所關注的GAN文章列表:
- Wasserstein GAN 的 TensorFlow 實現
- FAIR 提出常見 GAN 訓練方法的替代方法:WGAN
- 最小二乘GAN:比常規GAN更穩定,比WGAN收斂更迅速
- 新論文提出用GAN構建不同年齡時的樣貌:可讓你提前看到年老時的模樣
- 谷歌新論文提出適應性生成對抗網絡AdaGAN:增強生成模型
- GAN之父NIPS 2016演講現場直擊:全方位解讀生成對抗網絡的原理及未來
- 直觀理解GAN背后的原理:以人臉圖像生成為例
- 學界 | Yann LeCun 最新論文:基於能量的生成對抗網絡(附論文)
在此文:Face Aging With Conditional Generative Adversarial Networks 中,GANs用於人臉圖像合成,讓人提前看到年老時的模樣,還原Gans不同於一般DNN模型的特殊應用及主要存在意義。
人臉圖像合成和基於時間的預測,是一個判別函數的復合函數,但不同於GANs本身訓練過程的一個時間過程。K( f( x )) = { X——>K(Y) }|{ X = 人臉圖片的定義域,K(Y)={ 生成人臉圖片 } },結果不是判別的,而是生成的。K(x)是一個時序函數模型。
使用時間函數復合,可使從判別模型,到預測模型,判別的另外一個目的是用於假設,進而用於探索,逐步靠近真正地智慧所在。
從貝葉斯、馬爾科夫到預測/演繹模型
從可見條件推測模型,構造假設,用以探測真實,即是貝葉斯方法,是一種分析方法,使用了歸納,為判別模型。而預測模型,則使用了另一個重要的推理過程,演繹過程。從歸納到演繹,是處理問題的一般過程。時序GANs模型,是一個時間意義上的演繹模型。
為了做一些事情,僅僅是判別有什么意義!預測才有未來。以人為鏡可以整衣冠,以史為鏡可以見興衰。收集到妹子各方面的知識,用以構建妹子的思考模型,當然不是最終目的。目的是該怎樣選取一個怎樣最優的函數,才能把得上她。
文章用於生成不同年齡的圖片, 采用的模型是條件對抗網絡, 主要創新點是, 首先通過一個網絡, 提取圖像特征向量, 並通過身份保持網絡, 優化圖像的特征向量 , 得到特征向量, 之后便可以對於每個輸入年齡 , 查找其年齡向量, 並將該年齡向量與輸入圖片特征向量串聯/復合, 輸入生成網絡, 生成目標年齡圖片.
預測結果:
誤差編碼網絡 ENN
文章:如何預測未來的多種可能?采用ENN
在這篇論文中,作者們介紹了一種新的架構,它讓時間序列數據的條件預測也可以是多模態且健壯的。它的構建基於一個簡單的直覺,就是把未來狀態分成確定部分和隨機部分的組合;確定部分可以根據當前狀態直接做出預測,隨機的(或者說難以預測)的部分就代表了關於未來的不確定性。訓練這個確定性的網絡就能夠以網絡預測的形式獲得確定性因子,同時也得到了與真實狀態相比得到的預測誤差。這個誤差可以用低維隱含變量的形式編碼,然后送入第二個網絡中;這第二個網絡經過訓練后就可以利用這些額外的信息准確地更正前一個確定性網絡的預測結果。這就是論文中提出的誤差編碼網絡(Error Encoding Network,ENN)。
簡單來說,這個框架在三個時間步驟中分別含有三個函數映射:
第一個函數映射把當前狀態映射到未來狀態,它也就把未來狀態分成了確定性和不確定性的兩個部分
第二個函數映射是從不確定部分映射到低維隱含向量‘
第三個函數映射是基於隱含向量的條件,把當前狀態映射到未來狀態,這個過程中也就編碼了未來狀態的模式信息。
模型的訓練過程中會用到全部的三個映射,推理部分只需要最后一個映射。
模型架構
前述的兩個網絡都是根據監督學習的目標函數端到端訓練的,隱含變量是通過學到的參數化函數計算的,這樣一來訓練過程就可以簡單、快速。
翻一下這兩個很長的PPT:
預測學習:記憶網絡和對抗訓練是很有前景的方向,用預測學習代替無監督學習.................