Python ThreadPoolExecutor 線程池導致內存暴漲


背景

在有200W的任務需要取抓取的時候,目前采用的是線程池去抓取,最終導致內存暴漲。

原因

Threadpoolexcutor默認使用的是無界隊列,如果消費任務的速度低於生產任務,那么會把生產任務無限添加到無界隊列中。導致內存被占滿

解決方案

修改無界隊列為有界隊列

import queue

from concurrent.futures import ThreadPoolExecutor


class ThreadPoolExecutor(ThreadPoolExecutor):
    """
    重寫線程池修改隊列數
    """
    def __init__(self, max_workers=None, thread_name_prefix=''):
        super().__init__(max_workers, thread_name_prefix)
        # 隊列大小為最大線程數的兩倍
        self._work_queue = queue.Queue(self._max_workers * 2)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM