标签【机器学习常用算法及笔记】

　　网上有很多关于sklearn的学习教程，大部分都是简单的讲清楚某一方面，所以最好的教程其实就是官方文档。　　官方文档地址：https://scikit-learn.org/stable/ （ ...

　　在机器学习模型中，需要人工选择的参数称为超参数。比如随机森林中决策树的个数，人工神经网络模型中隐藏层层数和每层的节点个数，正则项中常数大小等等，他们都需要事先指定。超参数选择不恰当，就会出现欠拟合 ...

Python机器学习笔记：XgBoost算法

前言 1，Xgboost简介　　Xgboost是Boosting算法的其中一种，Boosting算法的思想是将许多弱分类器集成在一起，形成一个强分类器。因为Xgboost是一种提升树模型，所以它 ...

Python机器学习笔记：One Class SVM

前言　　最近老板有一个需求，做单样本检测，也就是说只有一个类别的数据集与标签，因为在工厂设备中，控制系统的任务是判断是是否有意外情况出现，例如产品质量过低，机器产生奇怪的震动或者机器零件脱落等。相 ...

　　Isolation，意为孤立/隔离，是名词，其动词为isolate，forest是森林，合起来就是“孤立森林”了，也有叫“独异森林”，好像并没有统一的中文叫法。可能大家都习惯用其英文的名字isol ...

随机森林算法的理论知识　　随机森林是一种有监督学习算法，是以决策树为基学习器的集成学习算法。随机森林非常简单，易于实现，计算开销也很小，但是它在分类和回归上表现出非常惊人的性能，因此，随机森林被誉 ...

　　Keras是一个用于深度学习的Python库，它包含高效的数值库Theano和TensorFlow。　　本文的目的是学习如何从csv中加载数据并使其可供Keras使用，如何用神经网络建立多类分 ...

完整代码及其数据，请移步小编的GitHub 　　传送门：请点击我　　如果点击有误：https://github.com/LeBron-Jian/MachineLearningNote 　　在数 ...

完整代码及其数据，请移步小编的GitHub 　　传送门：请点击我　　如果点击有误：https://github.com/LeBron-Jian/MachineLearningNote 　　上一 ...

　　在机器学习中，性能指标（Metrics）是衡量一个模型好坏的关键，通过衡量模型输出y_predict和y_true之间的某种“距离”得出的。　　对学习器的泛化性能进行评估，不仅需要有效可行的试 ...