通過Ambari2.7.3安裝HDP3.1.0成功之后,通過spark sql去查詢hive表的數據發現竟然無法查詢
HDP3.0 集成了hive 3.0和 spark 2.3,然而spark卻讀取不了hive表的數據,准確來說是內表的數據。
原因
hive 3.0之后默認開啟ACID功能,而且新建的表默認是ACID表。而spark目前還不支持hive的ACID功能,因此無法讀取ACID表的數據.
請看:https://issues.apache.org/jira/browse/SPARK-15348
解決辦法
修改以下參數讓新建的表默認不是acid表。
hive.strict.managed.tables=false hive.create.as.insert.only=false metastore.create.as.acid=false