今天裝了CM集群,在集群當中集成了impala,hive。然后一直覺得認為impala自動共享hive的元數據,最后發現好像並不是這樣的,需要經過一個同步元數據的操作才能實現數據的同步。
具體的做法如下:
(1)安裝好hive和impala,然后在hive當中創建目標數據庫,創建一張表
[root@VM200-120 ~]# impala-shell (通過shell的形式進入到impala的命令行當中)
2. 在Impala中同步元數據(這里的元數據是hive當中的元數據)
[VM200-120:21000] > INVALIDATE METADATA;
然后我們去hue的管理界面就可以看到impala當中已經同步了hive當中的數據。可以對數據進行操作了: