Ambari集群移動現有復制到另外地方或更改ip地址,導致各項服務組件上為黃色問號代表心跳丟失的解決方案(圖文詳解)(博主推薦)


 

 

前言

         最近,是在做集群搬移工作,大家肯定會遇到如下的場景。

         (1) 比如,你新購買的電腦,初步者學習使用Ambari集群。從舊電腦復制到新電腦這邊來

         (2) 比如,你公司Ambari集群的ip,因業務或其他情況需要,暫時需要更改ip

         (3) 比如,你更改了主機名

    (4)也許其他的原因

 

 

 

   擴展

linux虛擬機系統的復制或克隆后續問題解決!

 

 

 

 

 

 

問題詳情

 

 

 

 

  黃色問號表示: Heartbeat Lost

  即所有的服務都心跳丟失了。。重啟ambari-server和ambari-agent都不能解決。

 

 

 

 

 

 

 

 

 

解決途徑

  1、  查看個節點之間是否可以相互通信,若ssh連接不上,有可能是該節點關機了,沒有打開,手動開啟該節點,再次驗證是否可互通。

  2、  在主節點啟動ambari-server restart和ambari-agent restart,為了保證其它節點也成功啟動,在其它從節點也要進行:ambari-agent restart操作。

  3、  遇到問題

      3.1  mysql server start失敗

    在啟動過程中,經常出現mysql服務啟動失敗。查看失敗信息,找到是在哪個節點的mysql服務不能正常啟動,一般報錯是mysql.sock這個問題,解決方法:在對應節點上進行處理:mv /var/lib/mysql/mysql.sock  /var/lib/mysql/mysql.sock_bk. 然后再次啟動ambari服務。一般即可。

     3.2 datanode start 失敗

            1)關閉集群全部的服務 #ambari-service stop

          2)修改目錄所有者 #cd /data1/hadoop/

                         #chown –R hdfs:hadoop  hdfs/

          3)重啟集群服務 #ambari-service start 並且在ambari的界面start All所有組件。

      

 

 

     4、

  下次可以試着通過手動啟動來看看,出現的問題
  如果過你通過手動啟動的話,你就應該能看到報錯的信息。
 
 
 
 
 

 

 

  如果你的ip改變了,怎么來解決?

 

 

 

 

 

 

 

 

 

   如果你的主機名改變了,怎么來解決?

 

 

 

 

    

 最后,重新啟動所有節點上的ambari-server 和 ambari-agent

[bigdata@ambigdata1 ~]$ sudo service ambari-server stop
Using python  /usr/bin/python2
Stopping ambari-server
Ambari Server stopped
[bigdata@ambigdata1 ~]$ sudo service ambari-agent stop
Verifying Python version compatibility...
Using python  /usr/bin/python2
Found ambari-agent PID: 7495
Stopping ambari-agent
Removing PID file at /var/run/ambari-agent/ambari-agent.pid
ambari-agent successfully stopped
[bigdata@ambigdata1 ~]$ sudo service ambari-server start
Using python  /usr/bin/python2
Starting ambari-server
Ambari Server running with administrator privileges.
Organizing resource files at /var/lib/ambari-server/resources...
Server PID at: /var/run/ambari-server/ambari-server.pid
Server out at: /var/log/ambari-server/ambari-server.out
Server log at: /var/log/ambari-server/ambari-server.log
Waiting for server start....................
Ambari Server 'start' completed successfully.
[bigdata@ambigdata1 ~]$ sudo service ambari-agent start
Verifying Python version compatibility...
Using python  /usr/bin/python2
Checking for previously running Ambari Agent...
Starting ambari-agent
Verifying ambari-agent process status...
Ambari Agent successfully started
Agent PID at: /var/run/ambari-agent/ambari-agent.pid
Agent out at: /var/log/ambari-agent/ambari-agent.out
Agent log at: /var/log/ambari-agent/ambari-agent.log
[bigdata@ambigdata1 ~]$ 

  其他節點,不多贅述。

 

   

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  解決

 

 

 

 

 

 

 

 

 

歡迎大家,加入我的微信公眾號:大數據躺過的坑        人工智能躺過的坑
 
 
 

同時,大家可以關注我的個人博客

   http://www.cnblogs.com/zlslch/   和     http://www.cnblogs.com/lchzls/      http://www.cnblogs.com/sunnyDream/   

   詳情請見:http://www.cnblogs.com/zlslch/p/7473861.html

 

  人生苦短,我願分享。本公眾號將秉持活到老學到老學習無休止的交流分享開源精神,匯聚於互聯網和個人學習工作的精華干貨知識,一切來於互聯網,反饋回互聯網。
  目前研究領域:大數據、機器學習、深度學習、人工智能、數據挖掘、數據分析。 語言涉及:Java、Scala、Python、Shell、Linux等 。同時還涉及平常所使用的手機、電腦和互聯網上的使用技巧、問題和實用軟件。 只要你一直關注和呆在群里,每天必須有收獲

 

      對應本平台的討論和答疑QQ群:大數據和人工智能躺過的坑(總群)(161156071) 

 

 

 

 

 

 

 

 

 

 

 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM