作为一个数据人,是不是经常被各种名词围绕,是不是对其中很多概念认知模糊。有些词虽然只有一字之差,但是它们意思完全不同,今天我们就来了解下数仓建设及数据分析时常见的一些概念含义及它们之间的关系。 本文结构如下图所示: 一、数仓中常见概念解析 1. 实体 ...
作为一个数据人,是不是经常被各种名词围绕,是不是对其中很多概念认知模糊。有些词虽然只有一字之差,但是它们意思完全不同,今天我们就来了解下数仓建设及数据分析时常见的一些概念含义及它们之间的关系。 本文结构如下图所示: 一 数仓中常见概念解析 . 实体 实体是指依附的主体,就是我们分析的一个对象,比如我们分析商品的销售情况,如华为手机近半年的销售量是多少,那华为手机就是一个实体 我们分析用户的活跃度, ...
2021-09-09 13:49 0 471 推荐指数:
作为一个数据人,是不是经常被各种名词围绕,是不是对其中很多概念认知模糊。有些词虽然只有一字之差,但是它们意思完全不同,今天我们就来了解下数仓建设及数据分析时常见的一些概念含义及它们之间的关系。 本文结构如下图所示: 一、数仓中常见概念解析 1. 实体 ...
事实表:每个数据仓库都包含一个或者多个事实数据表。事实数据表可能包含业务销售数据,如销售商品所产生的数据,与软件中实际表概念一样 维度:说明数据,维度是指可指定不同值的对象的描述性属性或特征。例如,地理位置的维度可以包括“纬度”、“经度”或“城市名称”。“城市名称”维度的值 ...
在数据库表设计中会纠结于”自然键”和”代理键”的选择,自然键在实现数据“软删除”时实现比较复杂,部分自然键因为键值过长或多列组合导致不适合作为表主键,而比较常见两种代理键为自增列(auto incremnet)和全局唯一标识列(GUID)。 使用自增列作为主键的优缺点: 使用 ...
1.什么是KPI? KPI:指的是关键绩效指标,是Key Performance Indicator的缩写。 KPI通常在企业管理中使用,表示一种指标,这种指标往往是部门主管要求完成、衡量员工业绩的证明,是把企业的战略目标分解为可操作的工作目标的工具,是企业绩效管理的基础。 2.什么是痛点 ...
建表SQL参考:(每个字典一个表,比如办学类型一个表dim_bxlx,民族一个表dim_mz) ----更新 通常标准字典表中的字典名和原始表会有出入,例如标准字典为男女,原始 ...
什么是维度 维度是维度建模的基础和灵魂。在维度建模中,将度量称为“事实” ,将环境描述为“维度”,维度是用于分析事实所需要的多样环境。 例如,在分析交易过程时,可以通过买家、卖家、商品和时间等维度描述交易发生的环境。 什么是维度属性 维度所包含的表示维度的列,称为维度属性。维度 ...
数仓分层 1.ODS层 原始数据层,存放原始数据,直接加载原始日志、数据,数据保持原貌不做处理,起到备份数据的作用。数据采用LZO压缩,并创建索引减少磁盘存储空间(切片)。创建分区表,防止后续全表扫描。可以通过创建外部表供多人使用,内部表(仅供自己使用) 2.DWD层 明细数据层,对ODS层数 ...
数据模型是数据关系的一种映射,就是将业务之间的关系,用模型图形化展示出来,在设计数据仓库模型和架构的时候, ...