原文:数据仓库面试题

什么叫数据仓库 数据仓库是一个面向主题的 Subject Oriented 集成的 Integrate 相对稳定的 Non Volatile 反映历史变化 Time Variant 的数据集合,它用于支持企业或组织的决策分析处理。 数据仓库是为了便于多维分析和多角度展现而将数据按特定的模式进行存储所建立起来的关系型数据库,它的数据基于OLTP源系统。 首先,用于支持决策,面向分析型数据处理,它不同 ...

2019-02-23 18:33 0 5797 推荐指数:

查看详情

数据仓库面试题

离线数仓面试题?1、ODS:存放原始数据,直接加载原始日志,数据数据保持原貌不做处理。2、DWS:结构和粒度与原始表保持一致,对ODS层数据进行清洗(去除空值,脏数据)3、DWS:以DWD层为基础,进行轻度汇总。4、ADS:为各种统计报表提供数据。为什么要对数仓进行分层?1、把简单问题复杂 ...

Sat Aug 21 21:47:00 CST 2021 0 142
hive 数据仓库面试题目集锦

内部表和外部表的区别: 未被external修饰的是内部表(managed table),被external修饰的为外部表(external table);区别:内部表数据由Hive自身管理,外部表数据由HDFS管理;内部表数据存储的位置是hive.metastore.warehouse.dir ...

Tue Sep 22 15:39:00 CST 2020 0 725
数据面试题(一)----HADOOP 面试题

1. 下列哪项通常是集群的最主要瓶颈(C) A. CPU B. 网络 C. 磁盘IO D. 内存 2. 下列哪项可以作为集群的管理工具?(C) A.Puppet B.Pdsh C.Cl ...

Thu Feb 06 00:55:00 CST 2020 0 2348
什么是数据仓库?如何构建数据仓库

1. 什么是数据仓库? 在wiki中对数据仓库的解释是:   在计算中,数据仓库(DW或DWH),也称为企业数据仓库(EDW),是用于报告和数据分析的系统,被认为是商业智能的核心组成部分 DW是来自一个或多个不同来源的集成数据的中央存储库。 他们将当前和历史数据存储在一个地方,用于为整个企业 ...

Sat Jul 18 05:27:00 CST 2020 0 806
[面试仓库]CSS面试题汇总--布局篇

一,盒模型   说到 CSS 布局这块的内容,首当其冲的就是我们的盒模型宽度计算问题,在开始我们的问题之前,我们首先要搞懂这些概念: 盒模型里面的内容(content): 也就是实实在在要展 ...

Thu Apr 15 05:43:00 CST 2021 0 618
数据仓库】|1 所以,什么是数据仓库

声明: 1. 本栏是个人总结,如有错漏,请指正 2. 数据仓库的构建目前业界只有指导方案,并没有统一的标准,每个公司都可以按照实际情况进行设计 3. 本总结参考《阿里巴巴大数据之路》、《数据仓库工具箱》 产生背景 ...

Wed May 19 01:22:00 CST 2021 0 1227
数据仓库(四)——数据仓库系统

第一章 数仓搭建-ODS层 1)保持数据原貌不做任何修改,起到备份数据的作用。 2)数据采用LZO压缩,减少磁盘存储空间。100G数据可以压缩到10G以内。 3)创建分区表,防止后续的全表扫描,在企业开发中大量使用分区表。 4)创建外部表。在企业开发中,除了自己用的临时表,创建内部表外 ...

Thu Feb 17 22:10:00 CST 2022 0 695
hadoop入门到实战(3)hive数据仓库入门到实战及面试

第一章、hive入门 一、hive入门手册 1.什么是数据仓库 1.1数据仓库概念 对历史数据变化的统计,从而支撑企业的决策。比如:某个商品最近一个月的销量,预判下个月应该销售多少,从而补充多少货源。 1.2传统数据仓库面临的挑战 (1)无法满足快速增长的海量数据存储需求 (2)无法有效 ...

Thu May 14 00:23:00 CST 2020 1 1584
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM