一、度量、指标、指标器 度量和维度构成OLAP的主要概念,对于在事实表或者一个多维立方体里面存放的数值型的、连续的字段,就是度量。这符合上面的意思,有标准,一个度量字段肯定是统一单位,例如元、户数。如果一个度量字段,其中的度量值可能是欧元又有可能是美元,那这个度量没法汇总。 在OLAP中 ...
下面内容摘自互联网并作了整理。 名词: BI Business Intelligence :商业智能, DW Data Warehouse :数据仓库,详见正文Q 部分。 OLTP On Line Transaction Processing :联机事务处理 也称为面向交易的处理系统,其基本特征是顾客的原始数据能够马上传送到计算中心进行处理,并在非常短的时间内给出处理结果。这样做的最大长处是能够 ...
2014-11-06 19:35 0 5889 推荐指数:
一、度量、指标、指标器 度量和维度构成OLAP的主要概念,对于在事实表或者一个多维立方体里面存放的数值型的、连续的字段,就是度量。这符合上面的意思,有标准,一个度量字段肯定是统一单位,例如元、户数。如果一个度量字段,其中的度量值可能是欧元又有可能是美元,那这个度量没法汇总。 在OLAP中 ...
许多商业企业运营中的大量数据,通常称为购物篮事务(market basket transaction)。表中每一行对应一个事务,包含一个唯一标识TID。 利用关联分析的方法可以发现联系如关联规则或频繁项集。 关联分析需要处理的关键问题: 从大型事务数据集中发现模式可能在计算上要付出很高 ...
问题:数据总量爆炸式增加,如何从中提取真正有价值的信息,产生了新的领域(DM)。几个名词: 1)Data Mining:数据挖掘 2)Knowledge Discovery:知识发现 3)Machine Learning:机器学习(机器学习是数据挖掘的一个重要工具 ...
一.基本概念 我们来看上面的事务库,如同上表所示的二维数据集就是一个购物篮事务库。该事物库记录的是顾客购买商品的行为。这里的TID表示一次购买行为的编号,items表示顾客购买了哪些商品。 事务: 事务库中的每一条记录被称为一笔事务。在上表的购物篮事务中,每一笔事务都表示一次 ...
没有系统学过数学优化,但是机器学习中又常用到这些工具和技巧,机器学习中最常见的优化当属凸优化了,这些可以参考Ng的教学资料:http://cs229.stanford.edu/section/cs229-cvxopt.pdf,从中我们可以大致了解到一些凸优化的概念,比如凸集,凸函数,凸 ...
Preface:本文将会讲述 BI/DW/DA 领域的一些常见概念,如:事实表、维度表、建模、多维分析、cube 等,但不涉及具体实例分析。 1、维(Dimension) 维是用于从不同角度描述事物特征的,一般维都会有多层(Level:级别),每个Level都会包含一些共有的或特有的属性 ...
1. 数据仓库 数据仓库一词尚没有一个统一的定义,著名的数据仓库专家W. H. Inmon 在其著作《Buildingthe Data Warehouse》一书中给予如下描述:数据仓库(Data Warehouse) 是一个面向主题的(Subject Oriented) 、集成 ...
数仓是一个面向主题的、集成的、稳定的、时变的,存储历史数据的仓库。 面向主题的:数仓中的数据按照主题进行存储,每个主题都是决策层分析的一个角度; 集成的:不同来源的数据会统一整合后存入数仓中; 稳定的:数据一旦进入仓库后不会轻易发生改变,就算数据本身需要变化也轻易不会改动原数据,会根据分析 ...