hive小文件合並


hive小文件合並。

當使用union all會產生多個文件夾,可以設定distributed by 或者reduce個數。

 

hive合並。

SET hive.exec.dynamic.partition=true; SET hive.exec.dynamic.partition.mode=nonstrict; set hive.exec.max.dynamic.partitions=3000; set hive.exec.max.dynamic.partitions.pernode=500; SET hive.tez.container.size=6656; SET hive.tez.java.opts=-Xmx5120m; set hive.merge.tezfiles=true; set hive.merge.smallfiles.avgsize=1280000000; set hive.merge.size.per.task=1280000000; set hive.execution.engine=tez;

tez引擎合並。
set mapred.reduce.tasks =1;
set tez.am.container.reuse.enabled=true;
set tez.runtime.io.sort.mb=1024;
Set hive.tez.container.size=4096;
Set hive.tez.java.opts=-Xmx2g;
set hive.merge.tezfiles=true;
set hive.merge.smallfiles.avgsize=128000000;
set hive.merge.size.per.task=128000000;
 
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM