一、統一配置系統環境
(除了特別提醒之外,所有步驟三台都需要安裝)
配置說明
CDH需要內存要求比較高,本教程在在家用台式家16G VMware虛擬機情況下安裝。
hadoop-master 8G
hadoop-node01 2G
hadoop-node02 2G
編輯hosts文件
echo -e '10.0.102.218 hadoop-master \n10.0.102.133 hadoop-node01 \n10.0.102.136 hadoop-node02 ' >>/etc/hosts
echo -e '' >>/etc/hosts
查看hosts文件
cat /etc/hosts
關閉centos7防火牆
systemctl stop firewall
systemctl disable firewall
臨時關閉selinux
setenforce 0
getenforce 0
永久關閉selinux
SELINUX=enforcing 改為 SELINUX=disabled
安裝常用軟件
yum -y install lrzsz nmap nc tree htop wget vim bash-completion rsync ntp sysstat telnet dos2unix unzip mlocate
yum -y install chkconfig python bind-utils psmisc libxslt zlib sqlite cyrus-sasl-plain cyrus-sasl-gssapi fuse portmap fuse-libs redhat-lsb
配置時間同步
(這里不詳細說明,可以找網上的相關文檔進行操作)
echo '#同步時間' >> /var/spool/cron/root
echo '*/5 * * * * /usr/sbin/ntpdate -u 10.0.61.4 >/dev/null 2>&1' >>/var/spool/cron/root
修改hostname
設置免密登錄互通
ssh-keygen -t rsa
ssh-copy-id root@10.0.102.218
ssh-copy-id root@10.0.102.133
ssh-copy-id root@10.0.102.136
ssh-copy-id root@hadoop-node01
ssh-copy-id root@hadoop-node02
ssh-copy-id root@hadoop-master
查詢是否安裝jdk
rpm -qa openjdk
將原來的jdk卸載
rpm -e --nodeps #找到的jdk版本
安裝jdk環境
推薦rpm包安裝,不需要配置環境變量
二進制包配置環境變量
將java添加環境變量
sudo vim /etc/profile
# 在該文件末尾添加以下行
export JAVA_HOME=/usr/java/jdk1.8.0_162
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
檢查java版本
[root@Hadoop-node01 share]# java -version
java version "1.8.0_162"
Java(TM) SE Runtime Environment (build 1.7.0_80-b15)
Java HotSpot(TM) 64-Bit Server VM (build 24.80-b11, mixed mode)
二、安裝mysql5.6(僅master需要安裝)
https://blog.csdn.net/qq_35873847/article/details/78710266
創建數據庫(也可以在后面根據安裝的需求來創建)
create database hive DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
create database amon DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
create database hue DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
create database monitor DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
create database oozie DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
grant all on *.* to root@"%" Identified by "123456";
三、配置CDH環境
安裝Cloudera-Manager
解壓cm tar包到指定目錄所有服務器都要(或者在主節點解壓好,然后通過scp到各個節點同一目錄下)
tar -axvf cloudera-manager-centos7-cm5.7.6_x86_64.tar.gz -C /opt/cloudera-manager
將CM拷貝到其它節點
scp -r /opt/cm-5.7.6/ root@hadoop-node01:/opt/
scp -r /opt/cm-5.7.6/ root@hadoop-node02:/opt/
創建cloudera-scm用戶(所有節點)
useradd --system --home=/opt/cm-5.7.6/run/cloudera-scm-server --no-create-home --shell=/bin/false --comment "Cloudera SCM User" cloudera-scm
配置從節點cloudera-manger-agent指向主節點服務器
vim /opt/cm-5.7.6/etc/cloudera-scm-agent/config.ini
將server_host改為CMS所在的主機名即Hadoop-master
主節點中創建parcel-repo倉庫目錄並制作本地源
mkdir -p /opt/cloudera/parcel-repo
chown -R cloudera-scm:cloudera-scm /opt/cloudera/
cp CDH-5.7.6-1.cdh5.7.6.p0.18-el7.parcel CDH-5.7.6-1.cdh5.7.6.p0.18-el7.parcel.sha manifest.json /opt/cloudera/parcel-repo
注意:其中CDH-5.7.6-1.cdh5.7.6.p0.18-el5.parcel.sha1 后綴要把1去掉
修改cm-5.7.6文件夾屬主數組
chown -R cloudera-scm:cloudera-scm /opt/cm-5.7.6
所有節點創建parcels目錄
mkdir -p /opt/cloudera/parcels
chown -R cloudera-scm:cloudera-scm /opt/cloudera
解釋:Clouder-Manager將CDHs從主節點的/opt/cloudera/parcel-repo目錄中抽取出來,分發解壓激活到各個節點的/opt/cloudera/parcels目錄中】
拷貝mysql-connector-java到各個節點指定目錄下(所有的節點)
mkdir -p /usr/share/java/
mv mysql-connector-java-5.1.36-bin.jar /usr/share/java/mysql-connector-java.jar
初始腳本配置數據庫scm_prepare_database.sh(在主節點上)
/opt/cm-5.7.6/share/cmf/schema/scm_prepare_database.sh mysql -hlocalhost -uroot -p123456 --scm-host localhost scm scm scm
說明:這個腳本就是用來創建和配置CMS需要的數據庫的腳本。各參數是指:
mysql:數據庫用的是mysql,如果安裝過程中用的oracle,那么該參數就應該改為oracle。
-hHadoop-master:數據庫建立在Hadoop-master主機上面。也就是主節點上面。
-uroot:root身份運行mysql。-123456:mysql的root密碼是***。
--scm-host Hadoop-master:CMS的主機,一般是和mysql安裝的主機是在同一個主機上。
最后三個參數是:數據庫名,數據庫用戶名,數據庫密碼。
四、修改修改運行的參數
修改linux swap空間的swappiness
Cloudera 建議將 /proc/sys/vm/swappiness 設置為 0。
修改swappiness的值為零:
有一個問題:
運行echo 10 > /proc/sys/vm/swappiness
要永久改變
vim /etc/sysctl.conf
vm.swappiness=10
echo never>/sys/kernel/mm/transparent_hugepage/defrag
echo never>/sys/kernel/mm/transparent_hugepage/enabled
五、web界面安裝
web界面一路next就行了,安裝包選擇那里注意不要選擇從網絡下載了,國內根本下載不動,要選擇從本地parcel-repo倉庫安裝。最后一步安裝軟件的時候,
一定要選擇最小化安裝,要不然這種配置肯定會崩潰的。
總結:
整個過程安裝還是比較簡單的,但是需要細心,自己安裝三遍才成功。最后一步安裝最小化集群的出錯,肯定是前期那里環境配置出了問題,
要不然就是你的電腦太渣,電腦是8G的同學但是又想學習CDH的,去阿里雲買按小時計算的服務器吧,或者利用公司的服務器資源來安裝。