原文:第十章 Hive调优 【笛卡尔积】

...

2022-02-11 11:07 0 901 推荐指数:

查看详情

hive笛卡尔积的优化

由于一个业务,必须要进行笛卡尔积,但是速度太慢了,left join时左表大概4万条数据,右表大概 3000多条数据,这样大概就是一亿多条数据, 这在大数据领域其实不算很大的数据量,但是hive中跑的特别慢。因为hive笛卡尔积支持的不是很好,由于是全局的操作,所以只能在一个reduce中 ...

Sun Aug 16 17:51:00 CST 2020 0 2629
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM