标签【机器学习知识】

偏度和峰度的计算

偏度(skewness)和峰度(kurtosis)：偏度能够反应分布的对称情况，右偏（也叫正偏），在图像上表现为数据右边脱了一个长长的尾巴，这时大多数值分布在左侧，有一小部分值分布在右侧。 ...

使用sklearn进行交叉验证

模型评估方法假如我们有一个带标签的数据集D，我们如何选择最优的模型？衡量模型好坏的标准是看这个模型在新的数据集上面表现的如何，也就是看它的泛化误差。因为实际的数据没有标签，所以泛化误差是不可 ...

统计学当中关于变量的分类

统计学中的变量指的是研究对象的特征，我们有时也称为属性，例如人的身高、性别等。每个变量都有变量的值和变量的类型。我们按照变量的类型对变量进行划分。统计学中的变量（variables ...

牛顿法和牛顿迭代法

牛顿法，大致的思想是用泰勒公式的前几项来代替原来的函数，然后对函数进行求解和优化。牛顿法和应用于最优化的牛顿法稍微有些差别。牛顿法牛顿法用来迭代的求解一个方程的解，原理如下：对于一个函数f( ...

sklearn中的超参数调节

进行参数的选择是一个重要的步骤。在机器学习当中需要我们手动输入的参数叫做超参数，其余的参数需要依靠数据来进行训练，不需要我们手动设定。进行超参数选择的过程叫做调参。进行调参应该有一下准备条件： ...

数据分析常用数据集下载

经常用到数据分析常用的数据集，收集挺麻烦的。取之于网络，还之于人民数据集名称下载地址数据集介绍天池二手车价格预测 ...

F1值，准确率，召回率

1、混淆矩阵混淆矩阵中T、F、P、N的含义： T:真，F:假，P:阳性，N:阴性然后组合： TP:真阳性 TN:真阴性 FP:假阳性 FN:假阴性 2、精确率（准确率）：你认为对的中，有 ...

histogram 和 bar plot的区别

最本质的区别是这样的：histogram用来描述的是numerical变量，而bar plot用来描述的是categorical类型的变量。统计学当中关于变量的分类这可以从它们的图形上面看 ...

回归问题的性能度量标准

我们以$Y = \{ y_1, y_2,...,y_n \}$ 表示真实的数据，以$\hat Y = \{ \hat{y}_1, \hat{y}_2,...,\hat{y}_n\}$表示预测出来的数 ...

简书原作者 skullfang https://www.jianshu.com/p/9ee85fdad150 https://blog.csdn.net/zrh_CSDN/article/detai ...