原文:【大数据面试】【数仓项目】其他知识点:行为数仓、业务数仓、拉链表、即席查询

一 用户行为数仓. 数仓分层架构图 埋点行为数据基本格式 基本字段 项目经验总结 MySQL的高可用 存储元数据,搭建时要进行高可用HA 日期函数 date add date sub函数 加减日期 next day函数 周指标相关 date format函数 根据格式整理日期 last day函数 求当月最后一天日期 collect set函数 get json object解析json函数 Un ...

2021-12-16 21:34 0 124 推荐指数:

查看详情

1.4 |业务搭建| 拉链表| Presto

电商业务数据结构 SKU库存量单位,剩余多少;现在已经被引申为产品统一编号的简称,每种产品均对应有唯一的SKU号;每个商品都是一个SKU,每个SKU都有自己独立的库存。也就是说每一个商品详情展示都是一个SKU(比如iPhone手机的SKU--银色、128G内存、支持联通网以这个为单位记录 ...

Mon Mar 25 07:39:00 CST 2019 0 2250
大数据】什么是

我有自己的博客啦,欢迎各位客官前来哦!戳我进入! 什么是 一、是什么 ,全称就是数据仓库,是一个面向主题,集成的,相对稳定的,反映历史变化的数据集合,通常用于支持管理决策。这里的主题指的是为了分析数据而创造产生的各种有助于决策的数据模型。 随着互联网的发展,数据 ...

Sat Nov 14 04:29:00 CST 2020 0 5477
大数据开发---拉链表概述,以及如何迭代或者回滚

1.背景 拉链表是什么,在数建立时候,一种重要的表数据处理方式,可以将数据结构于算法,类比于拉链表,旨在解决建立里面的SCD需求,那么什么是SCD,就是缓慢变化维,随着时间流逝,数据相对事实表发生缓慢变化。 SCD的常用处理方式有以下几种: 保留原值 直接覆盖 ...

Mon Dec 14 07:57:00 CST 2020 0 566
电子商务大数据平台实训用户行为业务总结

1 用户行为业务总结 1.1 分几层?每层做什么的? 1)ODS层(原始数据层) 存储原始数据,直接加载原始日志、数据数据保持原貌不做处理。 2)DWD层(明细层) 对ODS层数据进行清洗(去除空值、脏数据,超过极限范围的数据) 3)DWS层(服务数据层) 以DWD层为基础 ...

Tue Sep 21 03:46:00 CST 2021 0 104
传统如何转型大数据

大家好,我是一哥,前几天建了一个数据仓库方向的小群,收集了大家的一些问题,其中有个问题,一哥很想去谈一谈——现在做传统,如何快速转到大数据数据呢?其实一哥知道的很多同事都是从传统数据仓库转到大数据的,今天就结合身边的同事经历来一起分享一下。 一、数据仓库 数据仓库:数据仓库系统的主要应用 ...

Thu Nov 26 01:57:00 CST 2020 0 609
1.3 |行为数据| 业务数据需求

只要是insert into 的就是没分区 需求一:用户活跃主题 DWS层--(用户行为宽表层) 目标:统计当日、当周、当月活动的每个设备明细 1 每日活跃设备明细 dwd_start_log--->dws_uv_detail_day --把相同的字段collect_set ...

Thu Mar 21 06:31:00 CST 2019 1 1681
传统 BI 如何转大数据

前几天建了一个数据仓库方向的小群,收集了大家的一些问题,其中有个问题,一哥很想去谈一谈——现在做传统,如何快速转到大数据数据呢?其实一哥知道的很多同事都是从传统数据仓库转到大数据的,今天就结合身边的同事经历来一起分享一下。 数据仓库 数据仓库:数据仓库系统的主要应用主要 ...

Thu May 20 23:23:00 CST 2021 0 404
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM