一次python 內存泄漏解決過程


最近工作中慢慢開始用python協程相關的東西,所以用到了一些相關模塊,如aiohttp, aiomysql, aioredis等,用的過程中也碰到的很多問題,這里整理了一次內存泄漏的問題

通常我們寫python程序的時候也很少關注內存這個問題(當然可能我的能力還有待提升),可能寫c和c++的朋友會更多的考慮這個問題,但是一旦我們的python程序出現了

內存泄漏的問題,也將是一件非常麻煩的事情了,而最近的一次代碼中也碰到了這個問題,不過好在最后內存溢出不是我代碼的問題,而是所用到的一個包出現了內存的問題,下面我通過一個簡單的代碼模擬出內存的問題,然后也會將解決的過程描述一下,希望能幫助到遇到同樣問題的朋友。

一、復現問題

其實這次主要是在使用aiohttp寫一個接口的時候出現的問題,其實復現出問題非常容易,我們實現一個簡單的接受post請求接口的服務端,然后實現一個並發的客戶端來訪問這個接口,來查看內存的情況

注意: 這個問題是在一個包的特定版本出現的:multidict==4.5.1,我在整理這個文章2個小時前作者已經修復了這個問題發布了4.5.2版本,已經修復了內存的問題,並且我也進行了測試驗證

服務端代碼:

from aiohttp import web

async def hello(request):
    return web.json_response(await request.json())

app = web.Application()
app.add_routes([web.post('/', hello)])
web.run_app(app)

客戶端代碼:

import asyncio
import aiohttp

async def foo(times):
    data = {'foo': 1}
    async with aiohttp.ClientSession() as session:
        for x in range(times):
            resp = await session.post('http://localhost:8080', json=data)
            if not x % 100:
                print(await resp.json())

loop = asyncio.get_event_loop()
loop.run_until_complete(foo(100000))
loop.close()

因為我的代碼是在linux上跑的,或者mac上我們都可以通過htop非常方面的實時查看我們程序內存的占用情況,我們先將服務端啟動,查看一下我們此時的內存情況可以看到占用的

非常少,當我們打開客戶端之后,再次觀察我們可以看到內存不斷增長,及時我們客戶端運行完畢內存也不會降低。

 當客戶端結束之后的內存:

如果客戶端不停止的話內存會一直漲,最后的結果就是把你的系統內存吃完,然后被系統殺掉你的進程。

 

二、解決內存泄漏的過程

像上面的例子是一個非常簡單的程序,不復雜我們也並沒有做上面復雜的操作就是一個簡單的接受post請求的服務端,但是如果是在實際的項目中我們可能會寫非常復雜的業務邏輯,那到時候我們又如何找到是哪里導致的內存問題,當我碰到這個問題的時候,其實我和很多接觸python不久的人差不多,也是不知道怎么查這種問題,各種百度各種查,也找到了好多推薦的工具,memory_profiler庫,objgraph庫,graphviz工具,但是都沒有幫助我迅速的找到問題點在哪里,最后看到標准庫中的tracemalloc,地址:https://docs.python.org/3/library/tracemalloc.html

通過這個包很快幫我找到了內存泄漏的地方

接下來按照官網的方法我將代碼進行改寫,來測試到底哪里的問題導致的內存泄漏,更改后的服務端代碼為:

 

from aiohttp import web
import tracemalloc


async def hello(request):
    return web.json_response(await request.json())

async def get_info(request):
    snapshot2 = tracemalloc.take_snapshot()
    top_stats = snapshot2.compare_to(snapshot1, 'lineno')
    print(top_stats)
    return web.Response(text="ok")


if __name__ == '__main__':
    app = web.Application()
    app.add_routes(
        [
            web.post('/', hello),
            web.get("/get_info", get_info)
        ]
    )
    tracemalloc.start()
    snapshot1 = tracemalloc.take_snapshot()
    web.run_app(app)
注意print(top_stats)這行打印的結果最后要關注

 其實這里就是新增加了一個路由get_info, 我們啟動服務端之后開啟客戶端,當我們客戶端運行完畢之后,可以看到內存已經漲上去了,並且沒有不會釋放,這個時候,可以直接通過瀏覽器訪問get_info這個路由看看print打印的內容,這里將會打印出你程序運行到這個時候那一行的代碼內存增長的比較多,進行一次排序,前面的幾個其實都是需要你關注的,因為這里數據較多,我就只打印如下前幾個數據

 

<StatisticDiff traceback=<Traceback (<Frame filename='/Users/zhaofan/anaconda3/lib/python3.6/site-packages/aiohttp/web_response.py' lineno=56>,)> size=116500672 (+116500672) count=300004 (+300004)>,


<StatisticDiff traceback=<Traceback (<Frame filename='/Users/zhaofan/anaconda3/lib/python3.6/site-packages/aiohttp/web_response.py' lineno=604>,)> size=11400000 (+11400000) count=200000 (+200000)>,


<StatisticDiff traceback=<Traceback (<Frame filename='/Users/zhaofan/anaconda3/lib/python3.6/site-packages/aiohttp/web_response.py' lineno=472>,)> size=8000000 (+8000000) count=100000 (+100000)>,

<StatisticDiff traceback=<Traceback (<Frame filename='/Users/zhaofan/anaconda3/lib/python3.6/site-packages/aiohttp/web_response.py' lineno=353>,)> size=5500000 (+5500000) count=100000 (+100000)>,


<StatisticDiff traceback=<Traceback (<Frame filename='/Users/zhaofan/anaconda3/lib/python3.6/site-packages/aiohttp/web_response.py' lineno=352>,)> size=5300608 (+5300608) count=100001 (+100001)>,

 

我們拿第一行來說,我們可以非常清楚的指導web_response的56行代碼導致內存增長的最多,當然如果是我們復雜的項目也可以通過類似的方法,這樣就可以非常快捷的找到我們代碼中哪些地方會造成內存溢出,便於排查問題,我們點進去看看這行代碼:

我們找到最終行,這個時候我們大致就可以看出哪里的問題了,我們接着看  CIMultiDict

class CIMultiDict(MultiDict):

    def _title(self, key):
        return key.title()

我們可以看到這個它繼承  MultiDict 其實這里我們已經應該知道問題就是處在這個MultiDict上了

而這個最終其實最終就是MultiDict這個包,問題出在了這個包上,這個項目是在這里維護的:https://github.com/aio-libs/multidict

查看這個包的時候看到了,果然有人和我遇到了同樣的問題,問題就是出在這里了,已經有人提交了bug

https://github.com/aio-libs/multidict/issues/307

不過不得不說國外的程序員真的是熱愛自己的職業,很快這個問題得到了aio-libs小組中人的回應,問題也在我整理這個博客的時候被修復了,在最新的版本:4.5.2中已經測試沒有內存泄漏的問題

 

三、總結

在這里處理的過程中,其實發現了自己很多的不足,查找問題的方式,以及遇到這種問題的解決思路,不過經過這次,至少下次遇到同樣的問題,自己能很快的去查找

以及解決問題,還有就是針對https://docs.python.org/3/library/tracemalloc.html這個庫的使用,也推薦大家多了解一下。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM