偏度(skewness)和峰度(kurtosis): 偏度能够反应分布的对称情况,右偏(也叫正偏),在图像上表现为数据右边脱了一个长长的尾巴,这时大多数值分布在左侧,有一小部分值分布在右侧。 ...
偏度(skewness)和峰度(kurtosis): 偏度能够反应分布的对称情况,右偏(也叫正偏),在图像上表现为数据右边脱了一个长长的尾巴,这时大多数值分布在左侧,有一小部分值分布在右侧。 ...
模型评估方法 假如我们有一个带标签的数据集D,我们如何选择最优的模型? 衡量模型好坏的标准是看这个模型在新的数据集上面表现的如何,也就是看它的泛化误差。因为实际的数据没有标签,所以泛化误差是不可 ...
统计学中的变量指的是研究对象的特征,我们有时也称为属性,例如人的身高、性别等。 每个变量都有变量的值和变量的类型。我们按照变量的类型对变量进行划分。 统计学中的变量(variables ...
牛顿法,大致的思想是用泰勒公式的前几项来代替原来的函数,然后对函数进行求解和优化。牛顿法和应用于最优化的牛顿法稍微有些差别。 牛顿法 牛顿法用来迭代的求解一个方程的解,原理如下: 对于一个函数f( ...
进行参数的选择是一个重要的步骤。在机器学习当中需要我们手动输入的参数叫做超参数,其余的参数需要依靠数据来进行训练,不需要我们手动设定。进行超参数选择的过程叫做调参。 进行调参应该有一下准备条件: ...
经常用到数据分析常用的数据集,收集挺麻烦的。取之于网络,还之于人民 数据集名称 下载地址 数据集介绍 天池二手车价格预测 ...
1、混淆矩阵 混淆矩阵中T、F、P、N的含义: T:真,F:假,P:阳性,N:阴性 然后组合: TP:真阳性 TN:真阴性 FP:假阳性 FN:假阴性 2、精确率(准确率): 你认为对的中,有 ...
最本质的区别是这样的:histogram用来描述的是numerical变量,而bar plot用来描述的是categorical类型的变量。统计学当中关于变量的分类 这可以从它们的图形上面看 ...
我们以$Y = \{ y_1, y_2,...,y_n \}$ 表示真实的数据,以$\hat Y = \{ \hat{y}_1, \hat{y}_2,...,\hat{y}_n\}$表示预测出来的数 ...
简书 原作者 skullfang https://www.jianshu.com/p/9ee85fdad150 https://blog.csdn.net/zrh_CSDN/article/detai ...