1.取流水表的數據時,如果是使用全部分區數據,不能從SA層數據取數,需要改從SH層取數,因為SH層為parquet存儲,查詢性能較好。
2.對於腳本中使用的臨時表,如果存在以下情況需要進行統計表信息
1)本身數據量較大
2)需要和大量數據表進行關聯
3)本身被較多次使用
3.對於重復使用計算的SQL,需要事前計算好數據,放到臨時表中使用,節省計算資源消耗。
4.一段SQL盡量用最少left join等關聯,可以多些SQL塊來執行。
1.取流水表的數據時,如果是使用全部分區數據,不能從SA層數據取數,需要改從SH層取數,因為SH層為parquet存儲,查詢性能較好。
2.對於腳本中使用的臨時表,如果存在以下情況需要進行統計表信息
1)本身數據量較大
2)需要和大量數據表進行關聯
3)本身被較多次使用
3.對於重復使用計算的SQL,需要事前計算好數據,放到臨時表中使用,節省計算資源消耗。
4.一段SQL盡量用最少left join等關聯,可以多些SQL塊來執行。
本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。