踩坑 Spring Cloud Hystrix 線程池隊列配置


原文:https://www.cnblogs.com/seifon/p/9921774.html

 

背景:

有一次在生產環境,突然出現了很多筆還款單被掛起,后來排查原因,發現是內部系統調用時出現了Hystrix調用異常。在開發過程中,因為核心線程數設置的比較大,沒有出現這種異常。放到了測試環境,偶爾有出現這種情況,后來在網上查找解決方案,網上的方案是調整maxQueueSize屬性就好了,當時調整了一下,確實有所改善。可沒想到在生產環境跑了一段時間后卻又出現這種了情況,此時我第一想法就是去查看maxQueueSize屬性,可是maxQueueSize屬性是設置值了。當時就比較納悶了,為什么maxQueueSize屬性不起作用,后來通過查看官方文檔發現Hystrix還有一個queueSizeRejectionThreshold屬性,這個屬性是控制隊列最大閾值的,而Hystrix默認只配置了5個,因此就算我們把maxQueueSize的值設置再大,也是不起作用的。兩個屬性必須同時配置

先看一下正確的Hystrix配置姿勢。

application.yml:

Copy
hystrix:  threadpool:  default:  coreSize: 200 並發執行的最大線程數,默認10  maxQueueSize: 1000 BlockingQueue的最大隊列數,默認值-1  queueSizeRejectionThreshold: 800 即使maxQueueSize沒有達到,達到queueSizeRejectionThreshold該值后,請求也會被拒絕,默認值5 

 

 

接下來編寫一個測試類,來驗證幾種錯誤配置,看看會出現什么情況。

測試類代碼(A調用方):

Copy

/** * @Author: XiongFeng * @Description: * @Date: Created in 11:12 2018/6/11 */ public class RepaymentHelperTest extends FundApplicationTests { @Autowired RepaymentHelper repaymentHelper; @Autowired private RouterFeign routerFeign; @Test public void hystrixTest() throws InterruptedException { for (int i = 0; i < 135; i++) { new Thread(new Runnable() { @Override public void run() { job(); } }).start(); } Thread.currentThread().join(); } public void job() { String repaymentNo = "xf1002"; String transNo = "T4324324234"; String reqNo = "xf1002"; String begintime = "20180831130030"; String endtime = "20180831130050"; TransRecQueryReqDto transRecQueryReqDto = new TransRecQueryReqDto(); transRecQueryReqDto.setTransNo(transNo); transRecQueryReqDto.setBeginTime(begintime); transRecQueryReqDto.setEndTime(endtime); transRecQueryReqDto.setReqNo(reqNo); Resp<List<TransRecDto>> queryTransRecListResp = routerFeign.queryTransRec(new Req<>(repaymentNo, "2018080200000002", null, null, transRecQueryReqDto)); System.out.println(String.format("獲取結果為:【%s】", JsonUtil.toJson(queryTransRecListResp))); } } 
  • 這個測試類的作用就是創建135個線程,通過RouterFeign類並發請求B服務方,看看請求結果是否出現異常。

Feign調用代碼:

Copy

@FeignClient(value = "${core.name}", fallbackFactory = RouterFeignBackFactory.class, path = "/router") public interface RouterFeign { /** * 代扣結果查詢 * @param transRecQueryReqDtoReq * @return */ @PostMapping("/queryTransRec") Resp<List<TransRecDto>> queryTransRec(@RequestBody Req<TransRecQueryReqDto> transRecQueryReqDtoReq); } 
  • 這個類,就是通過Feign方式去調用B服務方的客戶端

服務提供方代碼(B服務方):

Copy
/** * @Author: XiongFeng * @Description: * @Date: Created in 16:04 2018/5/24 */ @Api("還款服務") @RefreshScope @RestController @RequestMapping("/router") public class TestController { private static Logger logger = LoggerFactory.getLogger(TestController.class); // 計數器 private static AtomicInteger count = new AtomicInteger(1); @ApiOperation(value = "代扣結果查詢") @PostMapping("/queryTransRec") Resp<List<TransRecDto>> queryTransRec(@RequestBody Req<TransRecQueryReqDto> transRecQueryReqDtoReq) throws InterruptedException { System.out.println(String.format("查詢支付結果......計數: %s", count.getAndAdd(1))); Thread.sleep(500); return Resp.success(RespStatus.SUCCESS.getDesc(), null); } 
  • 這個類的作用,就是一個服務提供方,計數並返回結果。

下面我們看一下幾種錯誤的配置。

案例一(將核心線程數調低,最大隊列數調大一點,但是隊列拒絕閾值設置小一點):
Copy
hystrix: threadpool: default: coreSize: 10 maxQueueSize: 1000 queueSizeRejectionThreshold: 20 
此時的結果:

image

  • 左窗口是B服務方,右窗口是A調用方。從結果可以看出,調用135次,成功32次左右,其余線程全部拋異常。
案例二(將核心線程數調低,最大隊列數調小一點,但是隊列拒絕閾值設置大一點):
Copy
hystrix: threadpool: default: coreSize: 10 maxQueueSize: 15 queueSizeRejectionThreshold: 2000 
此時的結果:
Copy
java.util.concurrent.RejectedExecutionException: Task java.util.concurrent.FutureTask@7d6d472b rejected from java.util.concurrent.ThreadPoolExecutor@17f8bcb7[Running, pool size = 3, active threads = 3, queued tasks = 15, completed tasks = 0] 

image

  • 左窗口是B服務方,右窗口是A調用方。從結果可以看出,調用135次,成功25次左右,其余線程全部拋異常。。
案例三(將核心線程數調低,最大隊列數調大一點,但是隊列拒絕閾值不設置值):
Copy
hystrix: threadpool: default: coreSize: 10 maxQueueSize: 1500 
此時的結果:
Copy
java.util.concurrent.RejectedExecutionException: Rejected command because thread-pool queueSize is at rejection threshold. 

image

  • 左窗口是B服務方,右窗口是A調用方。此時的結果和案例一的情況一樣,調用135次,成功47次左右,其余線程全部拋異常。報錯跟案例一一樣
案例四(將核心線程數調低,最大隊列數不設值,但是隊列拒絕閾值設置的比較大):
Copy
hystrix: threadpool: default: coreSize: 10 queueSizeRejectionThreshold: 1000 
此時的結果:
Copy
java.util.concurrent.RejectedExecutionException: Task java.util.concurrent.FutureTask@23d268ea rejected from java.util.concurrent.ThreadPoolExecutor@66d0e2f4[Running, pool size = 0, active threads = 0, queued tasks = 0, completed tasks = 0] at java.util.concurrent.ThreadPoolExecutor$AbortPolicy.rejectedExecution(ThreadPoolExecutor.java:2063) at java.util.concurrent.ThreadPoolExecutor.reject(ThreadPoolExecutor.java:830) at java.util.concurrent.ThreadPoolExecutor.execute(ThreadPoolExecutor.java:1379) at java.util.concurrent.AbstractExecutorService.submit(AbstractExecutorService.java:112) 

image

  • 左窗口是B服務方,右窗口是A調用方。此時的結果和案例二的情況一樣,調用135次,成功10次左右,其余線程全部拋異常。報錯跟案例二一樣

下面來看一看正確的配置案例

案例一:將核心線程數調低,最大隊列數和隊列拒絕閾值的值都設置大一點):
Copy
hystrix: threadpool: default: coreSize: 10 maxQueueSize: 1500 queueSizeRejectionThreshold: 1000 
此時的結果:

image

  • 左窗口是B服務方,右窗口是A調用方。此時的結果就完全正常了,並發請求了135次,全部成功!
結論:官方默認隊列閾值只有5個, 如果要調整隊列,必須同時修改maxQueueSize和queueSizeRejectionThreshold屬性的值,否則都會出現異常!
參考文檔:

Spring Hystrix 官方文檔


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM