Spark無法讀取hive 3.x的表數據


通過Ambari2.7.3安裝HDP3.1.0成功之后,通過spark sql去查詢hive表的數據發現竟然無法查詢

HDP3.0 集成了hive 3.0和 spark 2.3,然而spark卻讀取不了hive表的數據,准確來說是內表的數據。

原因
hive 3.0之后默認開啟ACID功能,而且新建的表默認是ACID表。而spark目前還不支持hive的ACID功能,因此無法讀取ACID表的數據.
請看:https://issues.apache.org/jira/browse/SPARK-15348

解決辦法
修改以下參數讓新建的表默認不是acid表。

hive.strict.managed.tables=false hive.create.as.insert.only=false metastore.create.as.acid=false

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM