impala 中SQL的優化方法


1.取流水表的數據時,如果是使用全部分區數據,不能從SA層數據取數,需要改從SH層取數,因為SH層為parquet存儲,查詢性能較好。


2.對於腳本中使用的臨時表,如果存在以下情況需要進行統計表信息
    1)本身數據量較大
    2)需要和大量數據表進行關聯
    3)本身被較多次使用


3.對於重復使用計算的SQL,需要事前計算好數據,放到臨時表中使用,節省計算資源消耗。


4.一段SQL盡量用最少left join等關聯,可以多些SQL塊來執行。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM