2019/01/21下午,業務側反饋hive處理速度過慢,目前所有涉及hive的作業都很慢,影響這些業務不能在正常時間內完成
以下實例供參考,在生產環境中運行:
在Hive客戶端執行select count(*) from tableName;
table1中有20w數據,跑了30S出結果;
table2中有10億數據,跑了大概30分鍾出結果。
sql語句沒有變化,處理數據量無明顯增多,hive日志及yarn監控頁面日志均無報錯,且yarn監控頁面上隊列資源正常
目前hive堆內存正常,磁盤使用率、內存、cpu、網絡均沒有異常
使用情況截圖如下








問題現象:
2019/01/18開始,業務側反饋hive處理速度過慢,目前所有涉及hive的作業都很慢
檢查:
檢查hive日志,無報錯信息
檢查連接方式:使用hive直連,beeline連接測試,執行sql語句耗時一樣
檢查mysql日志,無錯誤提示
檢查mysql中元數據表是否添加加索引(有索引)
問題分析:
排除以上問題,查看yarn監控頁面
發現vcore基本用完
讀kafka數據的流程序占用116vcore
查看提交參數: num-executors 20 executor--cores 8
因為之前這個作業老是掉,調整了資源值,資源值擴大了10倍
解決辦法:
調整資源值 num-executors 8 executor--cores 4
測試: 跑10億條數據的表,測試正常,兩三分鍾跑完作業
2019/01/18開始,業務側反饋hive處理速度過慢,目前所有涉及hive的作業都很慢
檢查:
檢查hive日志,無報錯信息
檢查連接方式:使用hive直連,beeline連接測試,執行sql語句耗時一樣
檢查mysql日志,無錯誤提示
檢查mysql中元數據表是否添加加索引(有索引)
問題分析:
排除以上問題,查看yarn監控頁面
發現vcore基本用完
讀kafka數據的流程序占用116vcore
查看提交參數: num-executors 20 executor--cores 8
因為之前這個作業老是掉,調整了資源值,資源值擴大了10倍
解決辦法:
調整資源值 num-executors 8 executor--cores 4
測試: 跑10億條數據的表,測試正常,兩三分鍾跑完作業