CDH5.12.1 安裝部署

本文轉載自查看原文 2018-10-13 17:16 723

###通過http://192.168.50.200:7180/cmf/login 訪問CM控制台

4.CDH安裝

4.1CDH集群安裝向導

1.admin/admin登陸到CM

2.同意license協議，點擊繼續

3.選擇60試用，點擊繼續

4.點擊“繼續”

5.輸入主機IP或者名稱，點擊搜索找到主機名后點擊繼續

6.點擊“繼續”

7.使用parcel選項，點擊“更多選項”，點擊“-”刪除其他所有的地址，輸入http://ip-192-168-50-200.hns.com/cdh5.12.1/點擊“保存更改”

8.選擇自定義存儲庫，輸入cm的http地址

9.點擊“繼續”，進入下一步安裝jdk

10.點擊“繼續”，進入下一步，默認多用戶模式

11.點擊“繼續”，進入下一步配置ssh賬號密碼：

12.點擊“繼續”，進入下一步，安裝Cloudera Manager相關到各個節點

13.點擊“繼續”，進入下一步安裝cdh到各個節點

14.點擊“繼續”，進入下一步主機檢查，確保所有檢查項均通過

上述的解決方案：

在每台機器上執行如下操作：

[root@ip-192-168-50-200 ~]# echo never > /sys/kernel/mm/transparent_hugepage/enabled
[root@ip-192-168-50-200 ~]# echo never > /sys/kernel/mm/transparent_hugepage/defrag

[root@ip-192-168-50-200 ~]# echo "vm.swappiness = 10" >> /etc/sysctl.conf

[root@ip-192-168-50-200 ~]# sysctl -p

點擊完成進入服務安裝向導！！！

4.2 集群設置安裝向導

1.選擇需要安裝的服務，此處使用自定義服務，如下圖

2.點擊“繼續”，進入集群角色分配

HDFS角色分配：

Hive角色分配：

Cloudera Manager Service 角色分配：

Spark角色分配：（Spark on Yarn 所以沒有spark的master和worker 角色）

Yarn角色分配：

Zookeeper角色分配：（至少3個Server）

3.角色分配完成點擊“繼續”，進入下一步，測試數據庫連接

4.測試成功，點擊“繼續”，進入目錄設置，此處使用默認默認目錄，根據實際情況進行目錄修改

5.點擊“繼續”，等待服務啟動成功！！！

6.點擊“繼續”，顯示集群安裝成功！

7.安裝成功后，進入home管理界面

5.快速組建服務驗證

5.1HDFS驗證（mkdir+put+cat +get）

mkdir操作：

put 操作：

cat 操作：

get 操作：

5.2 Hive 驗證

使用hive命令行操作

hive> create external table test_table(
    > s1 string,
    > s2 string
    > )row format delimited fields terminated by ','
    > stored as textfile location '/hns/test';
OK
Time taken: 0.074 seconds
hive> show tables;
OK
test_table
Time taken: 0.012 seconds, Fetched: 1 row(s)

hive> select * from test_table;
OK
1 test
2 hns
3 zhangsan
Time taken: 0.054 seconds, Fetched: 3 row(s)
hive>

hive> insert into test_table values("4","lisi");
Query ID = hdfs_20181013220202_823a17d7-fb58-40e9-bf33-11f44d0de10a
Total jobs = 3
Launching Job 1 out of 3
Number of reduce tasks is set to 0 since there's no reduce operator
Starting Job = job_1539418452562_0003, Tracking URL = http://ip-192-168-50-200.hns.com:8088/proxy/application_1539418452562_0003/
Kill Command = /opt/cloudera/parcels/CDH-5.12.1-1.cdh5.12.1.p0.3/lib/hadoop/bin/hadoop job  -kill job_1539418452562_0003
Hadoop job information for Stage-1: number of mappers: 1; number of reducers: 0
2018-10-13 22:02:42,009 Stage-1 map = 0%,  reduce = 0%
2018-10-13 22:02:49,308 Stage-1 map = 100%,  reduce = 0%, Cumulative CPU 0.93 sec
MapReduce Total cumulative CPU time: 930 msec
Ended Job = job_1539418452562_0003
Stage-4 is selected by condition resolver.
Stage-3 is filtered out by condition resolver.
Stage-5 is filtered out by condition resolver.
Moving data to: hdfs://ip-192-168-50-200.hns.com:8020/hns/test/.hive-staging_hive_2018-10-13_22-02-31_572_2687237229927791201-1/-ext-10000
Loading data to table default.test_table
Table default.test_table stats: [numFiles=2, numRows=1, totalSize=31, rawDataSize=6]
MapReduce Jobs Launched: 
Stage-Stage-1: Map: 1   Cumulative CPU: 0.93 sec   HDFS Read: 3658 HDFS Write: 81 SUCCESS
Total MapReduce CPU Time Spent: 930 msec
OK
Time taken: 19.016 seconds
hive> select * from test_table;
OK
4 lisi 1       test
2       hns
3       zhangsan
Time taken: 0.121 seconds, Fetched: 4 row(s)
hive>

Hive MapReduce操作：

hive> select count(*) from test_table;
Query ID = hdfs_20181013220606_1011d0ce-9ddd-43ec-a103-18b3a32ea292
Total jobs = 1
Launching Job 1 out of 1
Number of reduce tasks determined at compile time: 1
In order to change the average load for a reducer (in bytes):
  set hive.exec.reducers.bytes.per.reducer=<number>
In order to limit the maximum number of reducers:
  set hive.exec.reducers.max=<number>
In order to set a constant number of reducers:
  set mapreduce.job.reduces=<number>
Starting Job = job_1539418452562_0004, Tracking URL = http://ip-192-168-50-200.hns.com:8088/proxy/application_1539418452562_0004/
Kill Command = /opt/cloudera/parcels/CDH-5.12.1-1.cdh5.12.1.p0.3/lib/hadoop/bin/hadoop job  -kill job_1539418452562_0004
Hadoop job information for Stage-1: number of mappers: 1; number of reducers: 1
2018-10-13 22:06:45,367 Stage-1 map = 0%,  reduce = 0%
2018-10-13 22:06:52,595 Stage-1 map = 100%,  reduce = 0%, Cumulative CPU 1.12 sec
2018-10-13 22:07:00,998 Stage-1 map = 100%,  reduce = 100%, Cumulative CPU 2.28 sec
MapReduce Total cumulative CPU time: 2 seconds 280 msec
Ended Job = job_1539418452562_0004
MapReduce Jobs Launched: 
Stage-Stage-1: Map: 1  Reduce: 1   Cumulative CPU: 2.28 sec   HDFS Read: 7350 HDFS Write: 2 SUCCESS
Total MapReduce CPU Time Spent: 2 seconds 280 msec
OK
4
Time taken: 24.471 seconds, Fetched: 1 row(s)

5.3 MapReduce 驗證：

[hdfs@ip-192-168-50-200 hadoop-mapreduce]$ pwd
/opt/cloudera/parcels/CDH/lib/hadoop-mapreduce

[hdfs@ip-192-168-50-200 hadoop-mapreduce]$ hadoop jar hadoop-mapreduce-examples.jar pi 5 5
Number of Maps  = 5
Samples per Map = 5
Wrote input for Map #0
Wrote input for Map #1
Wrote input for Map #2
Wrote input for Map #3
Wrote input for Map #4
Starting Job
.
.
.
18/10/13 22:12:33 INFO mapreduce.Job: Running job: job_1539418452562_0005
18/10/13 22:12:41 INFO mapreduce.Job: Job job_1539418452562_0005 running in uber mode : false
18/10/13 22:12:41 INFO mapreduce.Job:  map 0% reduce 0%
18/10/13 22:12:49 INFO mapreduce.Job:  map 40% reduce 0%
18/10/13 22:12:54 INFO mapreduce.Job:  map 80% reduce 0%
18/10/13 22:12:59 INFO mapreduce.Job:  map 100% reduce 0%
18/10/13 22:13:03 INFO mapreduce.Job:  map 100% reduce 100%
18/10/13 22:13:03 INFO mapreduce.Job: Job job_1539418452562_0005 completed successfully
18/10/13 22:13:03 INFO mapreduce.Job: Counters: 49
        File System Counters
.
.
.

5.4 Spark 驗證

scala> val testFile=sc.textFile("hdfs://ip-192-168-50-200.hns.com:8020/hns/test/a.txt")
testFile: org.apache.spark.rdd.RDD[String] = hdfs://ip-192-168-50-200.hns.com:8020/hns/test/a.txt MapPartitionsRDD[1] at textFile at <console>:27

scala> testFile.count()
res2: Long = 3

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 CENTOS6.5安裝CDH5.12.1(一) https://mp.weixin.qq.com/s/AP_m0QqKgzEUfjf0PQCX-w CDH 安裝與部署 Cloudera Manager和CDH安裝部署 CDH 部署 Hadoop：5.開始安裝【CDH部署】CDH6.2安裝配置第二篇：CDH安裝的前期配置親測實用的CDH安裝部署--Master CentOS 7安裝Qt5.12.1過程 CentOS7安裝CDH 第五章：CDH的安裝和部署-CDH5.7.0 Tez 整合Hadoop CDH 5.3.0安裝部署大數據平台CentOS7+CDH5.12.1集群搭建