大數據系列整個課程課程大綱


 

  • 大數據體系結構(開源組件介紹),讓你對當前大數據技術棧一目了然;

  • Linux命令基礎實戰;

  • Hadoop基礎對Hadoop架構、核心組件HDFS/YARN做了深入淺出的介紹,讓你快速把握Hadoop的核心技術和工作原理,逐漸形成分布式思維;

  • Sqoop作為關系型數據庫與Hadoop之間的橋梁,批量傳輸數據,讓你自然的從關系型數據庫過度到Hadoop平台,在關系型數據庫與Hadoop之間游刃有余的進行數據導入導出;

  • Hive,基於Hadoop大數據平台的數據倉庫,可以讓你實現傳統數據倉庫中的絕大部分數據處理、統計分析,讓你在Hadoop大數據平台上感受到Hive QL帶來的便利的交互式查詢體驗;Mars將以日志分析或其他示例帶大家熟練掌握Hive的應用;

  • HBase,列式存儲數據庫,提供了快速的查詢方式,是Apache Kylin的默認數據存儲結果;

  • Kylin,基於Hadoop的OLAP分析引擎,在Kylin中可以實現傳統OLAP的各種操作,直接讀取Hive的數據或流式數據作為數據源,把這些數據根據業務模型構建成Cube,Kylin提供了基於Hadoop(MapReduce)的Cube構建,Build完成的Cube數據直接存儲於HBase中。Kylin提供了Web UI供查詢,包括一些圖表展現,是基於大數據的完美OLAP工具;

  • Spark,基於內存計算的大數據計算引擎,提供了Spark SQL、Spark MLlib(基於Spark的機器學習)、SparkR等框架適應不同的應用需求,Spark專題將和大家一起實踐操作各種應用和算法;

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM