默認hive on spark是禁用的,需要在Cloudera Manager中啟用。
1.登錄CM界面,打開hive服務。
2.單擊 配置標簽,查找enable hive on spark屬性。
3.勾選Enbale Hive on Spark(Unsupported),並保存更改。
4.查找Spark on YARN 服務,並勾選保存。
5.保存后,重新部署下客戶端使其生效。
在Spark上配置Hive
最低要求角色: 配置器(也由群集管理員 提供,完全管理員)要配置Hive在Spark上運行,請執行以下兩個步驟:
- 配置Hive客戶端中所述使用Spark執行引擎配置單元執行引擎。
-
set hive.execution.engine=spark;
-
set hive.execution.engine;
- 確定Hive使用的Spark服務。Cloudera Manager自動將其設置為已配置的MapReduce或YARN服務以及已配置的Spark服務。請參閱配置Spark服務的Hive依賴關系。
配置Spark服務的Hive依賴關系
默認情況下,如果Spark服務可用,則配置Spark服務上的Hive依賴項。要更改此配置,請執行以下操作:- 在Cloudera Manager管理控制台中,轉至Hive服務。
- 單擊配置選項卡。
- 在YARN服務上搜索Spark。要配置Spark服務,請選擇Spark服務名稱。要刪除依賴項,請選擇none。
- 單擊保存更改。
- 轉到Spark服務。
- 將Spark網關角色添加到運行HiveServer2的主機。
- 點擊Cloudera Manager徽標返回主頁。
- 單擊
任何陳舊的服務旁邊的圖標以調用集群重新啟動向導。
- 單擊重新啟動舊服務。
- 單擊立即重新啟動。
- 單擊完成。
- 在Hive客戶端中,配置Spark執行引擎。
參考:https://www.cloudera.com/documentation/enterprise/latest/topics/admin_hos_oview.html#concept_i22_l1h_1v__section_k22_l1h_1v