前言
最近,是在做集群搬移工作,大家肯定會遇到如下的場景。
(1) 比如,你新購買的電腦,初步者學習使用Ambari集群。從舊電腦復制到新電腦這邊來。
(2) 比如,你公司Ambari集群的ip,因業務或其他情況需要,暫時需要更改ip。
(3) 比如,你更改了主機名。
(4)也許其他的原因。
擴展
linux虛擬機系統的復制或克隆后續問題解決!
問題詳情


黃色問號表示: Heartbeat Lost
即所有的服務都心跳丟失了。。重啟ambari-server和ambari-agent都不能解決。
解決途徑
1、 查看個節點之間是否可以相互通信,若ssh連接不上,有可能是該節點關機了,沒有打開,手動開啟該節點,再次驗證是否可互通。
2、 在主節點啟動ambari-server restart和ambari-agent restart,為了保證其它節點也成功啟動,在其它從節點也要進行:ambari-agent restart操作。
3、 遇到問題
3.1 mysql server start失敗
在啟動過程中,經常出現mysql服務啟動失敗。查看失敗信息,找到是在哪個節點的mysql服務不能正常啟動,一般報錯是mysql.sock這個問題,解決方法:在對應節點上進行處理:mv /var/lib/mysql/mysql.sock /var/lib/mysql/mysql.sock_bk. 然后再次啟動ambari服務。一般即可。
3.2 datanode start 失敗
1)關閉集群全部的服務 #ambari-service stop
2)修改目錄所有者 #cd /data1/hadoop/
#chown –R hdfs:hadoop hdfs/
3)重啟集群服務 #ambari-service start 並且在ambari的界面start All所有組件。

4、
如果過你通過手動啟動的話,你就應該能看到報錯的信息。
如果你的ip改變了,怎么來解決?


如果你的主機名改變了,怎么來解決?

最后,重新啟動所有節點上的ambari-server 和 ambari-agent

[bigdata@ambigdata1 ~]$ sudo service ambari-server stop Using python /usr/bin/python2 Stopping ambari-server Ambari Server stopped [bigdata@ambigdata1 ~]$ sudo service ambari-agent stop Verifying Python version compatibility... Using python /usr/bin/python2 Found ambari-agent PID: 7495 Stopping ambari-agent Removing PID file at /var/run/ambari-agent/ambari-agent.pid ambari-agent successfully stopped [bigdata@ambigdata1 ~]$ sudo service ambari-server start Using python /usr/bin/python2 Starting ambari-server Ambari Server running with administrator privileges. Organizing resource files at /var/lib/ambari-server/resources... Server PID at: /var/run/ambari-server/ambari-server.pid Server out at: /var/log/ambari-server/ambari-server.out Server log at: /var/log/ambari-server/ambari-server.log Waiting for server start.................... Ambari Server 'start' completed successfully. [bigdata@ambigdata1 ~]$ sudo service ambari-agent start Verifying Python version compatibility... Using python /usr/bin/python2 Checking for previously running Ambari Agent... Starting ambari-agent Verifying ambari-agent process status... Ambari Agent successfully started Agent PID at: /var/run/ambari-agent/ambari-agent.pid Agent out at: /var/log/ambari-agent/ambari-agent.out Agent log at: /var/log/ambari-agent/ambari-agent.log [bigdata@ambigdata1 ~]$
其他節點,不多贅述。



解決
同時,大家可以關注我的個人博客:
http://www.cnblogs.com/zlslch/ 和 http://www.cnblogs.com/lchzls/ http://www.cnblogs.com/sunnyDream/
詳情請見:http://www.cnblogs.com/zlslch/p/7473861.html
人生苦短,我願分享。本公眾號將秉持活到老學到老學習無休止的交流分享開源精神,匯聚於互聯網和個人學習工作的精華干貨知識,一切來於互聯網,反饋回互聯網。
目前研究領域:大數據、機器學習、深度學習、人工智能、數據挖掘、數據分析。 語言涉及:Java、Scala、Python、Shell、Linux等 。同時還涉及平常所使用的手機、電腦和互聯網上的使用技巧、問題和實用軟件。 只要你一直關注和呆在群里,每天必須有收獲
對應本平台的討論和答疑QQ群:大數據和人工智能躺過的坑(總群)(161156071)






