梳理下client 連接hadoop 或hive失敗問題排查思路
該思路也能舉一反三應用在其他服務上
問題舉例:
這是使用hive-client代碼訪問連接失敗的問題
我們可以參考官方的排查思路
https://cwiki.apache.org/confluence/display/HADOOP2/ConnectionRefused
1.官方文章指出,絕大多數都是服務未啟動的原因,所以這里首先要查看 hadoop集群和hive元數據服務是否正常啟動

排除
接下來我我們參考官方的思路

2.檢查是否配置的是遠程主機和hosts映射

本機C:\Windows\System32\drivers\etc\hosts文件

排除
3.主機能否ping通

排除
如果不能ping通,則要查看下防火牆service iptables status
或者雲主機的網絡安全組規則
4.telnet IP port

發現無法連接
又telnet bigdata 8088端口發現可以訪問
那么肯定是9000端口相關配置有問題
如果是雲主機的,網絡安全組規則端口未放行也可能
使用natstat -nlp查看端口
可以看到9000端口是被綁定到127.0.0端口的,外部無法訪問到
查看core-site.xml配置文件
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
果然這里是localhost
<property>
<name>fs.defaultFS</name>
<value>hdfs://bigdata:9000</value>
</property>
修改后重啟集群 natstat -nlp
后續連接也正常
