使用緩存方式優化遞歸函數與lru_cache


一.遞歸函數的弊端

遞歸函數雖然編寫時用很少的代碼完成了龐大的功能,但是它的弊端確實非常明顯的,那就是時間與空間的消耗。

用一個斐波那契數列來舉例


import time

#@lru_cache(20)
def fibonacci(n):
    if n < 2:
        return 1
    else:
        return fibonacci(n - 1) + fibonacci(n - 2)

t1 = time.time()
print(fibonacci(35))
t2 = time.time()
print(t2 - t1)  # 4.007285118103027
t1 = time.time()
print(fibonacci(36))
t2 = time.time()
print(t2 - t1)  # 6.479698419570923

前面輸入的數較小,所以算的還算很快,但輸入到35、36來測試時已經要花上好幾秒來計算了,而且36比35計算時間多了兩秒多,可想而知數據再增大后消耗的時間增加的是越來越大的,因為這個遞歸函數的復雜性是O(2**n)

我們想一下這個函數遞歸的原理,流程,發現一個問題,計算fibonacci(35)的時候,是計算fibonacci(34)+fibonacci(33)的和,計算fibonacci(34)時,是計算的fibonacci(33)+fibonacci(32)的和,問題出現了,fibonacci(33)需要計算兩次,那不是重復了嘛,我們繼續遞歸向下拆分發現,幾乎所有的遞歸函數拆分為兩個函數的和時都會有重復計算,就想下面這個圖:

以fibonacci(5)舉例,這個圖里面有一大部分的數字是重復的,也就是說執行了很多的重復的函數,這使我們產生了一個想法,既然重復執行了,那我讓它直接返回之前執行時的返回值不就行了,至於之前執行時的返回值,給他存起來不就好了嗎,這就用到了我們下面要說的緩存思想

二.用緩存優化遞歸函數

我們定義一個裝飾器來做函數的緩存


import time

def cache_decorator(func):
    cache_dict = {}

    def decorator(arg):
        try:
            return cache_dict[arg]
        except KeyError:
            return cache_dict.setdefault(arg, func(arg))
    return decorator

@cache_decorator
def fibonacci(n):
    if n < 2:
        return 1
    else:
        return fibonacci(n - 1) + fibonacci(n - 2)

t1 = time.time()
print(fibonacci(35))
t2 = time.time()
print(t2 - t1)  # 0
t1 = time.time()
print(fibonacci(36))
t2 = time.time()
print(t2 - t1)  # 0

當使用了緩存的方式后,發現計算所用的時間已經接近0,我們把數再改大一點


t1 = time.time()
print(fibonacci(300))
t2 = time.time()
print(t2 - t1)  # 0.001026153564453125
t1 = time.time()
print(fibonacci(301))
t2 = time.time()
print(t2 - t1)  # 0.0

這也太厲害了,當把數增大到300時,花費的時間才是0.001秒,而且t2的計算結果為0也證明了的確裝飾器中緩存了數據,計算fibonacci(301)可直接從緩存中拿fibonacci(300)和fibonacci(299),我們用圖來更清晰的解釋

圖中用虛線所指的結點都不需要重新計算了,只計算了不重復的數字,也就是意味着復雜度從O(2**n)降到了O(n)

這種緩存的思想,給我們的優化帶來了巨大的收益

三.lru_cache裝飾器

上面的裝飾器是我們自己寫的,但它不適用與其他函數,比如有多個參數的函數,但是python標准庫為我們提供了一個非常方便的裝飾器來進行緩存

它是functools模塊中的lru_cache(maxsize,typed)

通過其名就能讓我們了解它,它是通過lru算法來進行緩存內容的淘汰,

maxsize參數設置緩存內存占用上限,其值應當設為2的冪,值為None時表示沒有上限

typed參數設置表示不同參數類型的調用是否分別緩存,這個參數的意思是如果設置為True,那么fibonacci(5)和fibonacci(5.0)將分別緩存,不存為一個。

lru_cache的使用只需要將上面我們自定義的裝飾器替換為 lru_cache(None,False)即可。


參考《python高級編程(第2版)》


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM