一. 深度學習概覽
1.為什么resnet應用在圖像識別
因為傳統神經網絡精度有限,而只是增加層數無法提高精度。而resnet可以改變這個問題。
2.Microsoft SwitchBoard
在語音識別中進行的突破。
3.微軟AI
兩個微軟做的圖像識別視頻識別,在網站上就可以跑,非常有趣!
https://customvision.ai/這個可以自己做一個分類識別
https://www.videoindexer.ai這個可以在視頻中把人分出來(有名人庫,名人可以查到姓名),還可以把這些人說的文字寫成文本(可以精確到人在幾分幾秒說話),把重要的部分打標簽,真的很高級!!!
下面是微軟的一款工具CNTK
CNTK(全開源)(微軟很多東西用它做訓練,和tenserflow還有caffe比好處就是特別快)代碼在github上開源,見鏈接:
https://github.com/Microsoft/CNTK
CNTK與其他對比就是在多GPU加速和多機器方面速度幾乎依然可以呈現線性增長,而不是增長速度大幅放慢。
4.最新的一些工具:
lightGBM
lightLDA
lightRNN
5.對偶學習(e.g.從圖像生成文字再從文字生成圖像,那么這兩個圖像都是圖像,可以尋找其中關系。)
因為很多機器學習依賴於人工標記一些數據,而這個的代價是非常昂貴的,所以通過對偶學習可以節省成本,優化框架。