花费 7 ms
大数据开发实战:Hadoop数据仓库开发实战

  1、Hadoop数据仓库架构设计          如上图。     ODS(Operation Data Store)层:ODS层通常也被称为准备区(Staging area),它们是后续 ...

Thu Aug 30 19:53:00 CST 2018 1 10828
大数据开发实战:Hive优化实战3-大表join大表优化

  5、大表join大表优化       如果Hive优化实战2中mapjoin中小表dim_seller很大呢?比如超过了1GB大小?这种就是大表join大表的问题。首先引入一个具体的问题场景,然 ...

Fri Aug 17 18:23:00 CST 2018 2 7450
大数据开发实战:实时数据平台和流计算

  1、实时数据平台整体架构          实时数据平台的支撑技术主要包含四个方面:实时数据采集(如Flume),消息中间件(如Kafka), 流计算框架(如Storm, Spark, Fli ...

Tue Aug 07 23:53:00 CST 2018 0 7308
大数据开发实战:数据流图及相关数据技术

  1、大数据流程图        2、大数据各个环节主要技术        2.1、数据处理主要技术     Sqoop:(发音:skup)作为一款开源的离线数据传输工具,主要用于H ...

Tue Aug 07 00:37:00 CST 2018 1 5405
大数据开发实战:Stream SQL实时开发一

  1、流计算SQL原理和架构     流计算SQL通常是一个类SQL的声明式语言,主要用于对流式数据(Streams)的持续性查询,目的是在常见流计算平台和框架(如Storm、Spark Stre ...

Wed Sep 05 19:22:00 CST 2018 0 3820
大数据开发实战:数据仓库技术

  1、OLTP和OLAP       OLTP的全称是 Online Transaction Processing, OLTP主要用传统的关系型数据库来进行事务处理。OLTP最核心的需求是单条记录 ...

Tue Aug 07 22:05:00 CST 2018 0 3883
大数据开发实战:Spark Streaming流计算开发

  1、背景介绍       Storm以及离线数据平台的MapReduce和Hive构成了Hadoop生态对实时和离线数据处理的一套完整处理解决方案。除了此套解决方案之外,还有一种非常流行的而且完 ...

Mon Sep 03 18:09:00 CST 2018 0 3484
大数据开发实战:Hive优化实战2-大表join小表优化

  4、大表join小表优化       和join相关的优化主要分为mapjoin可以解决的优化(即大表join小表)和mapjoin无法解决的优化(即大表join大表),前者相对容易解决,后者较 ...

Fri Aug 17 17:56:00 CST 2018 0 3484

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM