花费 13 ms
偏度和峰度的计算

偏度(skewness)和峰度(kurtosis): 偏度能够反应分布的对称情况,右偏(也叫正偏),在图像上表现为数据右边脱了一个长长的尾巴,这时大多数值分布在左侧,有一小部分值分布在右侧。 ...

Wed May 02 18:42:00 CST 2018 0 47320
使用sklearn进行交叉验证

模型评估方法 假如我们有一个带标签的数据集D,我们如何选择最优的模型? 衡量模型好坏的标准是看这个模型在新的数据集上面表现的如何,也就是看它的泛化误差。因为实际的数据没有标签,所以泛化误差是不可 ...

Tue Mar 13 19:52:00 CST 2018 0 33016
统计学当中关于变量的分类

统计学中的变量指的是研究对象的特征,我们有时也称为属性,例如人的身高、性别等。 每个变量都有变量的值和变量的类型。我们按照变量的类型对变量进行划分。 统计学中的变量(variables ...

Thu Dec 07 05:49:00 CST 2017 0 35947
牛顿法和牛顿迭代法

牛顿法,大致的思想是用泰勒公式的前几项来代替原来的函数,然后对函数进行求解和优化。牛顿法和应用于最优化的牛顿法稍微有些差别。 牛顿法 牛顿法用来迭代的求解一个方程的解,原理如下: 对于一个函数f( ...

Thu Aug 16 05:28:00 CST 2018 0 6351
sklearn中的超参数调节

进行参数的选择是一个重要的步骤。在机器学习当中需要我们手动输入的参数叫做超参数,其余的参数需要依靠数据来进行训练,不需要我们手动设定。进行超参数选择的过程叫做调参。 进行调参应该有一下准备条件: ...

Mon Apr 09 17:35:00 CST 2018 0 6984
数据分析常用数据集下载

经常用到数据分析常用的数据集,收集挺麻烦的。取之于网络,还之于人民 数据集名称 下载地址 数据集介绍 天池二手车价格预测 ...

Wed Mar 04 05:35:00 CST 2020 0 3665
F1值,准确率,召回率

1、混淆矩阵 混淆矩阵中T、F、P、N的含义: T:真,F:假,P:阳性,N:阴性 然后组合: TP:真阳性 TN:真阴性 FP:假阳性 FN:假阴性 2、精确率(准确率): 你认为对的中,有 ...

Mon Jul 20 22:26:00 CST 2020 0 2332
histogram 和 bar plot的区别

最本质的区别是这样的:histogram用来描述的是numerical变量,而bar plot用来描述的是categorical类型的变量。统计学当中关于变量的分类 这可以从它们的图形上面看 ...

Tue Dec 12 18:22:00 CST 2017 0 3366
回归问题的性能度量标准

我们以$Y = \{ y_1, y_2,...,y_n \}$ 表示真实的数据,以$\hat Y = \{ \hat{y}_1, \hat{y}_2,...,\hat{y}_n\}$表示预测出来的数 ...

Fri May 04 20:22:00 CST 2018 0 2378

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM