hive中 exists與left semi join

本文轉載自查看原文 2020-09-02 21:18 1002 hive

對比發現執行計划一樣，都是left semi join實現。且，left semi join前，會對t2表group by；

explain select t1.* from t1 left semi join t2 on t1.id=t2.id;
explain select t1.* from t1 where exists(select 1 from t2 where t1.id=t2.id);

所以如果使用exists或left semi join語法，性能一樣。
值得注意的是，t2表重復數據多的場景，應該是一樣的。
如果t2表沒有重復數據，也就不需要group by，此時可以選擇使用join語法代替，當然這個需要抽時間驗證研究一番。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Hive 中的 LEFT SEMI JOIN 與 JOIN ON HIVE中join、semi join、outer join HIVE中join、semi join、outer join舉例詳解 PostgreSQL中的not in、not exists、left join/is null hive left join 問題 HIVE LEFT JOIN的坑 MySQL中的semi-join hive中left/right join on連接中and與where的使用問題 exists(關聯表)與left join 的效率比較 Oracle，用left join 替代 exists ,not exists,in , not in，提高效率