一. 深度学习概览
1.为什么resnet应用在图像识别
因为传统神经网络精度有限,而只是增加层数无法提高精度。而resnet可以改变这个问题。
2.Microsoft SwitchBoard
在语音识别中进行的突破。
3.微软AI
两个微软做的图像识别视频识别,在网站上就可以跑,非常有趣!
https://customvision.ai/这个可以自己做一个分类识别
https://www.videoindexer.ai这个可以在视频中把人分出来(有名人库,名人可以查到姓名),还可以把这些人说的文字写成文本(可以精确到人在几分几秒说话),把重要的部分打标签,真的很高级!!!
下面是微软的一款工具CNTK
CNTK(全开源)(微软很多东西用它做训练,和tenserflow还有caffe比好处就是特别快)代码在github上开源,见链接:
https://github.com/Microsoft/CNTK
CNTK与其他对比就是在多GPU加速和多机器方面速度几乎依然可以呈现线性增长,而不是增长速度大幅放慢。
4.最新的一些工具:
lightGBM
lightLDA
lightRNN
5.对偶学习(e.g.从图像生成文字再从文字生成图像,那么这两个图像都是图像,可以寻找其中关系。)
因为很多机器学习依赖于人工标记一些数据,而这个的代价是非常昂贵的,所以通过对偶学习可以节省成本,优化框架。