!!!該系列使用三台虛擬機搭建一個完整的spark集群,集群環境如下:
virtualBox5.2、Ubuntu14.04、securecrt7.3.6_x64英文版(連接虛擬機)
jdk1.7.0、hadoop2.6.5、zookeeper3.4.5、Scala2.12.6、kafka_2.9.2-0.8.1、park1.3.1-bin-hadoop2.6
一、虛擬機配置
1、下載安裝三台虛擬機
我選擇的版本是virtualBox5.2、Ubuntu14.04,virtualBox用起來比VMware要輕便些,開關機快很多,個人體會
注意此處三台虛擬機要使用三個鏡像文件,分別放三個文件夾中
2、分別配置三台虛擬機靜態IP
http://www.cnblogs.com/suwy/p/9436211.html
3、配置虛擬機到本機映射(三台虛擬機)
進入本機目錄,打開hosts文件:C:\Windows\System32\drivers\etc
添加虛擬機IP:
192.168.1.124 spark1
192.168.1.123 spark2
192.168.1.125 spark3
cmd進入windows控制台就可以ping通虛擬機了
4、可以使用securecrt連接虛擬機 ,操作起來比較方便
參考:https://www.cnblogs.com/suwy/p/9436370.html
5、配置三台虛擬機之間的IP映射
$ vim /etc/hosts
添加如下(三台虛擬機的IP都要添加):
192.168.1.124 spark1
192.168.1.123 spark2
192.168.1.125 spark3
此時三台虛擬機之間可以相互ping通
二 、系統環境
1、安裝jdk
2、ssh免密碼登錄
下載ssh
apt-get install openssh-server
和單機的不同,集群還要設置幾台機器之間相互的免密碼登錄
對本機免密碼登錄:
$ ssh-keygen -t rsa
$ cd /root/.ssh
$ cp id_rsa.pub authorized_keys
三台機器之間的免密碼登錄:
$ ssh-copy-id -i 目標主機名
例如:當前機器spark1,要實現對spark2免密碼登錄,則在spark1命令行輸入
$ ssh-copy-id -i spark2