第十章 Hive調優 【小文件合並】
View Code View Code ...
View Code View Code ...
set mapreduce.job.reduces=1; -- 注意將reduce個數設置為1 才會生效 ...
由於一個業務,必須要進行笛卡爾積,但是速度太慢了,left join時左表大概4萬條數據,右表大概 3000多條數據,這樣大概就是一億多條數據, 這在大數據領域其實不算很大的數據量,但是hive中跑的特別慢。因為hive對笛卡爾積支持的不是很好,由於是全局的操作,所以只能在一個reduce中 ...