入門大數據


下面整理了“入門大數據”的一系列知識,可供學習和參考。

--Hadoop--

>>Hadoop是什么?

>>HDFS,Zookeeper,ZookeeperFailOverController(簡稱:ZKFC),JournalNode是什么?

>>HDFS-HA搭建

>>Hadoop常用命令

>>HDFS-API

>>Mapreduce,Yarn是什么?

>>通過Yarn搭建MapReduce和應用實例

>>MapReduce-API操作

 --Hive--

>>Hive是什么?

>>Hive的搭建

>>HiveCLI和Beeline命令行的基本使用

>>Hive常用DDL操作

>>Hive分區表和分桶表

>>Hive視圖和索引

>>Hive數據查詢詳解

>>Hive的計算引擎Tez的簡介和使用

 --Hbase--

>>Hbase是什么?

>>Hbase搭建

>>HBase Shell命令操作

>>Hbase_Java_API

>>Hbase過濾器詳解

>>Hbase協處理器詳解

>>Hbase容災與備份

>>Hbase的SQL中間層_Phoenix

>>Spring+Mybatis+Phoenix整合

 --Flume--

>>Flume 簡介及基本使用

>>Flume的搭建

>>Flume整合Kafka

 --Sqoop--

>>Sqoop簡介與安裝

>>Sqoop基本使用

>>通過Flume,Sqoop進行日志分析

 --CDH--

>>ClouderaManager和CDH是什么?

>>安裝ClouderaManager,CDH和Impala,Hue,oozie等服務

 --Storm--

>>流式計算簡介

>>Storm搭建與應用

 --Kafka--

>>Kafka簡介

>>基於Zookeeper搭建Kafka高可用集群

>>Kafka生產者詳解

>>Kafka消費者詳解

>>Kafka深入理解分區副本機制

>>Kafka的搭建與應用

 --Elasticsearch--

>>Elasticsearch是什么?

>>Elasticsearch搭建與應用

 --Redis--

>>數據存儲發展史

>>Redis集群分布式學習

 --Scala--

>>Scala簡介及開發環境配置

>>Scala基本數據類型和運算符

>>Scala流程控制語句

>>Scala_Array

>>Scala_Collection

>>Scala_List和Set

>>Scala_Map和Tuple 

>>Scala類和對象

>>Scala繼承和Trait 

>>Scala函數和閉包 

>>Scala模式匹配 

>>Scala類型參數 

>>Scala隱式轉換和隱式參數  

>>Scala總體學習

--Spark Core--

>>Spark簡介

>>Spark開發環境搭建

>>Spark_RDD

>>Spark_Transformation和Action算子

>>Spark部署模式與作業提交

>>Spark累加器與廣播變量 

>>基於Zookeeper搭建Spark高可用集群

--Spark SQL--

>>SparkSQL_Dataset和DataFrame簡介 

>>Spark_Structured API的基本使用 

>>SparkSQL外部數據源 

>>SparkSQL常用聚合函數 

>>SparkSQL聯結操作 

--Spark Streaming--

>>Spark_Streaming與流處理

>>Spark_Streaming基本操作 

>>Spark_Streaming整合Flume 

>>Spark_Streaming整合Kafka 

>>Spark整體復習

>>Spark車輛監控項目

--Azkaban--

>>Azkaban簡介

>>Azkaban_3.x_編譯及部署 

>>Azkaban_Flow_1.0_的使用 

>>Azkaban_Flow_2.0_的使用

 --Python--

>>Python基礎

>>Anaconda安裝

>>PySpark

>>機器學習與數據挖掘

>>道路擁堵預測項目

 --Kylin--

>>Kylin是什么?

>>Kylin搭建與應用

 --Flink--

>>Flink核心概念綜述

>>Flink開發環境搭建

>>Flink_Data_Source 

>>Flink_Data_Transformation

>>Flink_Data_Sink 

>>Flink_窗口模型 

>>Flink狀態管理與檢查點機制 

>>Flink_Standalone_集群部署

>>Flink學習總括

--優化--

>>大數據調優匯總

--打包--

>>大數據應用常用打包方式


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM