CDH Hadoop安裝


一、統一配置系統環境

(除了特別提醒之外,所有步驟三台都需要安裝)

配置說明

CDH需要內存要求比較高,本教程在在家用台式家16G VMware虛擬機情況下安裝。

hadoop-master 8G 
hadoop-node01 2G
hadoop-node02 2G

編輯hosts文件

echo -e '10.0.102.218 hadoop-master \n10.0.102.133 hadoop-node01 \n10.0.102.136 hadoop-node02 ' >>/etc/hosts
echo -e '' >>/etc/hosts

查看hosts文件

cat /etc/hosts

關閉centos7防火牆

systemctl stop firewall
systemctl disable firewall

臨時關閉selinux

setenforce 0
getenforce 0

永久關閉selinux
SELINUX=enforcing 改為 SELINUX=disabled

安裝常用軟件

yum -y install lrzsz nmap nc tree htop wget vim bash-completion rsync ntp sysstat telnet dos2unix unzip mlocate

yum -y install chkconfig python bind-utils psmisc libxslt zlib sqlite cyrus-sasl-plain cyrus-sasl-gssapi fuse portmap fuse-libs redhat-lsb

配置時間同步
(這里不詳細說明,可以找網上的相關文檔進行操作)

echo '#同步時間' >> /var/spool/cron/root
echo '*/5 * * * * /usr/sbin/ntpdate -u 10.0.61.4 >/dev/null 2>&1' >>/var/spool/cron/root

修改hostname

設置免密登錄互通

ssh-keygen -t rsa
ssh-copy-id root@10.0.102.218
ssh-copy-id root@10.0.102.133
ssh-copy-id root@10.0.102.136

ssh-copy-id root@hadoop-node01
ssh-copy-id root@hadoop-node02
ssh-copy-id root@hadoop-master

查詢是否安裝jdk

rpm -qa openjdk

將原來的jdk卸載

rpm -e --nodeps #找到的jdk版本

安裝jdk環境
推薦rpm包安裝,不需要配置環境變量
二進制包配置環境變量

將java添加環境變量

sudo vim /etc/profile

# 在該文件末尾添加以下行
export JAVA_HOME=/usr/java/jdk1.8.0_162 
export PATH=$JAVA_HOME/bin:$PATH 
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

檢查java版本
[root@Hadoop-node01 share]# java -version
java version "1.8.0_162"
Java(TM) SE Runtime Environment (build 1.7.0_80-b15)
Java HotSpot(TM) 64-Bit Server VM (build 24.80-b11, mixed mode)

二、安裝mysql5.6(僅master需要安裝)

https://blog.csdn.net/qq_35873847/article/details/78710266

創建數據庫(也可以在后面根據安裝的需求來創建)


create database hive DEFAULT CHARSET utf8 COLLATE utf8_general_ci;

create database amon DEFAULT CHARSET utf8 COLLATE utf8_general_ci;

create database hue DEFAULT CHARSET utf8 COLLATE utf8_general_ci;

create database monitor DEFAULT CHARSET utf8 COLLATE utf8_general_ci;

create database oozie DEFAULT CHARSET utf8 COLLATE utf8_general_ci;

grant all on *.* to root@"%" Identified by "123456";

三、配置CDH環境

安裝Cloudera-Manager
解壓cm tar包到指定目錄所有服務器都要(或者在主節點解壓好,然后通過scp到各個節點同一目錄下)

tar -axvf cloudera-manager-centos7-cm5.7.6_x86_64.tar.gz -C /opt/cloudera-manager

將CM拷貝到其它節點

scp -r /opt/cm-5.7.6/ root@hadoop-node01:/opt/
scp -r /opt/cm-5.7.6/ root@hadoop-node02:/opt/

創建cloudera-scm用戶(所有節點)

useradd --system --home=/opt/cm-5.7.6/run/cloudera-scm-server --no-create-home --shell=/bin/false --comment "Cloudera SCM User" cloudera-scm

配置從節點cloudera-manger-agent指向主節點服務器

vim /opt/cm-5.7.6/etc/cloudera-scm-agent/config.ini
將server_host改為CMS所在的主機名即Hadoop-master

主節點中創建parcel-repo倉庫目錄並制作本地源

mkdir -p /opt/cloudera/parcel-repo
chown -R cloudera-scm:cloudera-scm /opt/cloudera/
cp CDH-5.7.6-1.cdh5.7.6.p0.18-el7.parcel CDH-5.7.6-1.cdh5.7.6.p0.18-el7.parcel.sha manifest.json /opt/cloudera/parcel-repo
注意:其中CDH-5.7.6-1.cdh5.7.6.p0.18-el5.parcel.sha1 后綴要把1去掉

修改cm-5.7.6文件夾屬主數組

chown -R cloudera-scm:cloudera-scm /opt/cm-5.7.6

所有節點創建parcels目錄

mkdir -p /opt/cloudera/parcels
chown -R cloudera-scm:cloudera-scm /opt/cloudera

解釋:Clouder-Manager將CDHs從主節點的/opt/cloudera/parcel-repo目錄中抽取出來,分發解壓激活到各個節點的/opt/cloudera/parcels目錄中】

拷貝mysql-connector-java到各個節點指定目錄下(所有的節點)

mkdir -p /usr/share/java/
mv mysql-connector-java-5.1.36-bin.jar /usr/share/java/mysql-connector-java.jar

初始腳本配置數據庫scm_prepare_database.sh(在主節點上)
/opt/cm-5.7.6/share/cmf/schema/scm_prepare_database.sh mysql -hlocalhost -uroot -p123456 --scm-host localhost scm scm scm
說明:這個腳本就是用來創建和配置CMS需要的數據庫的腳本。各參數是指:
mysql:數據庫用的是mysql,如果安裝過程中用的oracle,那么該參數就應該改為oracle。
-hHadoop-master:數據庫建立在Hadoop-master主機上面。也就是主節點上面。
-uroot:root身份運行mysql。-123456:mysql的root密碼是***。
--scm-host Hadoop-master:CMS的主機,一般是和mysql安裝的主機是在同一個主機上。
最后三個參數是:數據庫名,數據庫用戶名,數據庫密碼。

四、修改修改運行的參數

修改linux swap空間的swappiness
Cloudera 建議將 /proc/sys/vm/swappiness 設置為 0。
修改swappiness的值為零:
有一個問題:
運行echo 10 > /proc/sys/vm/swappiness
要永久改變

vim /etc/sysctl.conf
vm.swappiness=10

echo never>/sys/kernel/mm/transparent_hugepage/defrag
echo never>/sys/kernel/mm/transparent_hugepage/enabled

五、web界面安裝

web界面一路next就行了,安裝包選擇那里注意不要選擇從網絡下載了,國內根本下載不動,要選擇從本地parcel-repo倉庫安裝。最后一步安裝軟件的時候,
一定要選擇最小化安裝,要不然這種配置肯定會崩潰的。

總結:

整個過程安裝還是比較簡單的,但是需要細心,自己安裝三遍才成功。最后一步安裝最小化集群的出錯,肯定是前期那里環境配置出了問題,
要不然就是你的電腦太渣,電腦是8G的同學但是又想學習CDH的,去阿里雲買按小時計算的服務器吧,或者利用公司的服務器資源來安裝。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM