-
大數據體系結構(開源組件介紹),讓你對當前大數據技術棧一目了然;
-
Linux命令基礎實戰;
-
Hadoop基礎,對Hadoop架構、核心組件HDFS/YARN做了深入淺出的介紹,讓你快速把握Hadoop的核心技術和工作原理,逐漸形成分布式思維;
-
Sqoop,作為關系型數據庫與Hadoop之間的橋梁,批量傳輸數據,讓你自然的從關系型數據庫過度到Hadoop平台,在關系型數據庫與Hadoop之間游刃有余的進行數據導入導出;
-
Hive,基於Hadoop大數據平台的數據倉庫,可以讓你實現傳統數據倉庫中的絕大部分數據處理、統計分析,讓你在Hadoop大數據平台上感受到Hive QL帶來的便利的交互式查詢體驗;Mars將以日志分析或其他示例帶大家熟練掌握Hive的應用;
-
HBase,列式存儲數據庫,提供了快速的查詢方式,是Apache Kylin的默認數據存儲結果;
-
Kylin,基於Hadoop的OLAP分析引擎,在Kylin中可以實現傳統OLAP的各種操作,直接讀取Hive的數據或流式數據作為數據源,把這些數據根據業務模型構建成Cube,Kylin提供了基於Hadoop(MapReduce)的Cube構建,Build完成的Cube數據直接存儲於HBase中。Kylin提供了Web UI供查詢,包括一些圖表展現,是基於大數據的完美OLAP工具;
-
Spark,基於內存計算的大數據計算引擎,提供了Spark SQL、Spark MLlib(基於Spark的機器學習)、SparkR等框架適應不同的應用需求,Spark專題將和大家一起實踐操作各種應用和算法;