HIVE處理速度過慢


2019/01/21下午,業務側反饋hive處理速度過慢,目前所有涉及hive的作業都很慢,影響這些業務不能在正常時間內完成 

以下實例供參考,在生產環境中運行: 
在Hive客戶端執行select count(*) from tableName; 
table1中有20w數據,跑了30S出結果; 
table2中有10億數據,跑了大概30分鍾出結果。 

sql語句沒有變化,處理數據量無明顯增多,hive日志及yarn監控頁面日志均無報錯,且yarn監控頁面上隊列資源正常 
目前hive堆內存正常,磁盤使用率、內存、cpu、網絡均沒有異常 
使用情況截圖如下

 

   

 
 
 
 
 
 
問題現象:
2019/01/18開始,業務側反饋hive處理速度過慢,目前所有涉及hive的作業都很慢
檢查:
檢查hive日志,無報錯信息
檢查連接方式:使用hive直連,beeline連接測試,執行sql語句耗時一樣
檢查mysql日志,無錯誤提示
檢查mysql中元數據表是否添加加索引(有索引)
問題分析:
排除以上問題,查看yarn監控頁面
發現vcore基本用完
讀kafka數據的流程序占用116vcore
查看提交參數: num-executors 20 executor--cores 8

因為之前這個作業老是掉,調整了資源值,資源值擴大了10倍
解決辦法:
調整資源值 num-executors 8 executor--cores 4
測試: 跑10億條數據的表,測試正常,兩三分鍾跑完作業


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM