数据挖掘概念与技术(韩家伟)阅读笔记7--数据离散化和概念分层的产生
1.数据离散化和概念分层的原理和目的 通过将属性值域划分为区间,用区间标记代替实际的数值,用来减少给定连续属性值的个数。 2.离散化技术分类 例如:自顶向下:首先找出一个或几个点作为分裂 ...
1.数据离散化和概念分层的原理和目的 通过将属性值域划分为区间,用区间标记代替实际的数值,用来减少给定连续属性值的个数。 2.离散化技术分类 例如:自顶向下:首先找出一个或几个点作为分裂 ...
1.冰山立方体的相关概念 部分物化的立方体成为冰山立方体,其中部分物化所使用的标准或最小阈值称为最小支持度阈值或简称为最小支持度。 冰山立方体SQL查询语句: conpute cub ...
异方差 定义:相对于同方差而言。同方差:总体回归函数中的随机误差项满足同方差性,即它们都有相同的方差。如果这一假定不满足,即:随机误差项具有不同的方差,则称线性回归模型存在异方差性。 产 ...