机器学习
定义
机器学习是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
还有其他几种定义:
(1)机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。
(2)机器学习是对能通过经验自动改进的计算机算法的研究。
(3)机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。
研究现状
机器学习的研究主要分为两类研究方向:
1、传统机器学习的研究,该类研究主要是研究学习机制,注重探索模拟人的学习机制
2、大数据环境下机器学习的研究,该类研究主要是研究如何有效利用信息,注重从巨量数据中获取隐藏的、有效的、可理解的知识
机器学习的分类
我们从不同的角度进行分类。
基于学习策略的分类。
1、模拟人脑的机器学习
- 符号学习
- 神经网络学习(连接学习)
2、直接采用数学方法的机器学习
主要是统计机器学习。
统计机器学习是基于对数据的初步认识以及学习目的的分析,选择合适的数学模型,拟定超参数,并输入样本数据,依据一定的策略,运用合适的学习算法对模型进行训练,最后运用训练好的模型对数据进行分析预测。
统计机器学习三个要素:
模型(model):模型在未进行训练前,其可能的参数是多个甚至无穷的,故可能的模型也是多个甚至无穷的,这些模型构成的集合就是假设空间。
策略(strategy):即从假设空间中挑选出参数最优的模型的准则。模型的分类或预测结果与实际情况的误差(损失函数)越小,模型就越好。那么策略就是误差最小。
算法(algorithm):即从假设空间中挑选模型的方法(等同于求解最佳的模型参数)。机器学习的参数求解通常都会转化为最优化问题,故学习算法通常是最优化算法,例如最速梯度下降法、牛顿法以及拟牛顿法等。
基于学习方法的分类
1、归纳学习
- 符号归纳学习
- 函数归纳学习
2、演绎学习
3、类比学习
4、分析学习
基于学习方式的分类
1、监督学习
2、无监督学习
3、强化学习
基于数据形式的分类
1、结构化学习
2、非结构化学习
基于学习目标的分类
1、概念学习
2、规则学习
3、函数学习
4、类别学习
5、贝叶斯网络学习
常见算法
决策树算法
朴素贝叶斯算法
支持向量机算法
随机森林算法
人工神经网络算法
Boosting与Bagging算法
关联规则算法
EM(期望最大化)算法
深度学习