原文:【大数据面试】【项目】数仓架构:离线、实时、数仓输入输出、选型、版本、服务器、集群规模、数据保存、组件安装分配

一 质疑分层不合理 云上大数据数仓解决方案:https: www.aliyun.com solution datavexpo datawarehouse 离线数仓 基于hive 实时数仓 基于kafka中间件 每一步都会缓存至datahub 二 数仓概念 数仓的数据源和输出系统分别是什么 数据源:用户行为数据 业务数据 爬虫 灰色地带,需要经过授权 数据输出:报表 用户画像 推荐等 版本选型 Ap ...

2021-12-15 22:20 0 126 推荐指数:

查看详情

大数据】什么是

我有自己的博客啦,欢迎各位客官前来哦!戳我进入! 什么是 一、是什么 ,全称就是数据仓库,是一个面向主题,集成的,相对稳定的,反映历史变化的数据集合,通常用于支持管理决策。这里的主题指的是为了分析数据而创造产生的各种有助于决策的数据模型。 随着互联网的发展,数据 ...

Sat Nov 14 04:29:00 CST 2020 0 5477
传统如何转型大数据

大家好,我是一哥,前几天建了一个数据仓库方向的小群,收集了大家的一些问题,其中有个问题,一哥很想去谈一谈——现在做传统,如何快速转到大数据数据呢?其实一哥知道的很多同事都是从传统数据仓库转到大数据的,今天就结合身边的同事经历来一起分享一下。 一、数据仓库 数据仓库:数据仓库系统的主要应用 ...

Thu Nov 26 01:57:00 CST 2020 0 609
大数据面试流程和重点面试

一、自我介绍 看简历+表达能力 2-3分钟左右(学历、参加工作、爱好、特长) 二、项目 背 三、数据仓库 1、以为中心 不要直接上来说ods、dwd、dws、ads 2、范式建模与维度建模的方式区别 3、主题划分是否合适 4、事实表与维度表的介绍 有多少张,哪些缓解进行 ...

Sun Jan 16 05:53:00 CST 2022 0 808
离线实时案例

1.数据仓库简介 数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。数据仓库是伴随着企业信息化发展起来的,在企业信息化的过程中,随着信息化 ...

Mon Aug 05 04:43:00 CST 2019 0 834
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM