HIVE處理速度過慢

本文轉載自查看原文 2022-02-22 10:25 1835 hadoop

2019/01/21下午，業務側反饋hive處理速度過慢，目前所有涉及hive的作業都很慢，影響這些業務不能在正常時間內完成

以下實例供參考，在生產環境中運行：
在Hive客戶端執行select count(*) from tableName;
table1中有20w數據，跑了30S出結果；
table2中有10億數據，跑了大概30分鍾出結果。

sql語句沒有變化，處理數據量無明顯增多，hive日志及yarn監控頁面日志均無報錯，且yarn監控頁面上隊列資源正常
目前hive堆內存正常，磁盤使用率、內存、cpu、網絡均沒有異常
使用情況截圖如下

問題現象:
2019/01/18開始，業務側反饋hive處理速度過慢，目前所有涉及hive的作業都很慢
檢查：
檢查hive日志，無報錯信息
檢查連接方式:使用hive直連,beeline連接測試,執行sql語句耗時一樣
檢查mysql日志，無錯誤提示
檢查mysql中元數據表是否添加加索引(有索引)
問題分析：
排除以上問題,查看yarn監控頁面
發現vcore基本用完
讀kafka數據的流程序占用116vcore
查看提交參數: num-executors 20 executor--cores 8

因為之前這個作業老是掉,調整了資源值,資源值擴大了10倍
解決辦法:
調整資源值 num-executors 8 executor--cores 4
測試: 跑10億條數據的表,測試正常,兩三分鍾跑完作業

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 MYSQLinsert速度過慢 npm速度過慢的解決方案 docker build速度過慢問題解決git下載速度過慢 npm速度過慢的解決方案解決Git Clone速度過慢的方法 ubuntu解決下載速度過慢 iOS cocoapods 速度過慢問題解決git clone 速度過慢的問題~ npm下載速度過慢的解決辦法