關於Python Profilers性能分析器


想了解一下python的性能調試方法,結果就看到這一篇文章,想翻譯下來作個記錄

原文來自於:http://docs.python.org/library/profile.html?highlight=profile#cProfile

1. 介紹性能分析器

profiler是一個程序,用來描述運行時的程序性能,並且從不同方面提供統計數據加以表述。Python中含有3個模塊提供這樣的功能,分別是cProfile, profile和pstats。這些分析器提供的是對Python程序的確定性分析。同時也提供一系列的報表生成工具,允許用戶快速地檢查分析結果。

Python標准庫提供了3個不同的性能分析器:

  1. cProfile,推薦給大部分的用戶,是C的一個擴展應用,因為其合理的運行開銷,所以適合分析運行時間較長的。是基於lsprof。
  2. profile,一個純python模塊,它的接口和cProfile一致。在分析程序時,增加了很大的運行開銷。如果你想擴展profiler的功能,可以試着繼承這個模塊
  3. hotshot, 一個試驗性的c模塊,關注減少分析時的運行開銷,但是是以需要更長的數據后處理的次數為代價。不過這個模塊不再被維護,也有可能在新的python版本中被棄用。

2. 使用方法

def foo():
    sum = 0
    for i in range(10000):
        sum += i
    sumA = bar()
    sumB = bar()
    return sum
    
def bar():
    sum = 0
    for i in range(100000):
        sum += i
    return sum
 
if __name__ == "__main__":
    import cProfile

    #直接把分析結果打印到控制台
    cProfile.run("foo()")
    #把分析結果保存到文件中,不過內容可讀性差...需要調用pstats模塊分析結果
    cProfile.run("foo()", "result")
    #還可以直接使用命令行進行操作
    #>python -m cProfile myscript.py -o result
    
    import pstats
    #創建Stats對象
    p = pstats.Stats("result")
    #這一行的效果和直接運行cProfile.run("foo()")的顯示效果是一樣的
    p.strip_dirs().sort_stats(-1).print_stats()
    #strip_dirs():從所有模塊名中去掉無關的路徑信息
    #sort_stats():把打印信息按照標准的module/name/line字符串進行排序
    #print_stats():打印出所有分析信息

    #按照函數名排序 
    p.strip_dirs().sort_stats("name").print_stats()

    #按照在一個函數中累積的運行時間進行排序
    #print_stats(3):只打印前3行函數的信息,參數還可為小數,表示前百分之幾的函數信息
    p.strip_dirs().sort_stats("cumulative").print_stats(3)

    #還有一種用法
    p.sort_stats('time', 'cum').print_stats(.5, 'foo')
    #先按time排序,再按cumulative時間排序,然后打倒出前50%中含有函數信息

    #如果想知道有哪些函數調用了bar,可使用
    p.print_callers(0.5, "bar")

    #同理,查看foo()函數中調用了哪些函數
    p.print_callees("foo")

以上是profile以及pstats模塊的簡單應用.

3.分析結果圖解

profile result

4. 什么是確定性性能分析(Deterministic Profiling)

確定性性能分析指的是反映所有的函數調用,返回,和異常事件的執行所用的時間,以及它們之間的時間間隔。相比之下,統計性性能分析指的是取樣有效的程序指令,然后推導出所需要的時間,后者花費比較少的開銷,但是給出的結果不夠精確。

在Python中,因為其是解釋性語言,所以在執行程序的時候,會加入解釋器的執行,這部分的執行是不需要進行性能分析的。Python自動為每一個事件提供一個hook,來定位需要分析的代碼。除此之外,因為Python解釋型語言的本質往往需要在執行程序的時候加入很多其它的開銷,而確定性性能分析只會加入一點點處理開銷。這樣一來,確定性性能分析其實開銷不大,還可以提供豐富的統計信息。

函數調用次數的統計能夠被用於確定程序中的bug,比如一個不符合常理的次數,明顯偏多之類的,還可以用來確定可能的內聯函數。函數內部運行時間的統計可被用來確定”hot loops”,那些需要運行時間過長,需要優化的部分;累積時間的統計可被用來確定比較高層次的錯誤,比如算法選擇上的錯誤。Python的性能分析可以允許直接比較算法的遞歸實現與迭代實現的。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM