Python函數參數默認值的陷阱和原理深究"


本文將介紹使用mutable對象作為Python函數參數默認值潛在的危害,以及其實現原理和設計目的

本博客已經遷移至:

http://cenalulu.github.io/

本篇博文已經遷移,閱讀全文請點擊:

http://cenalulu.github.io/python/default-mutable-arguments/

陷阱重現

我們就用實際的舉例來演示我們今天所要討論的主要內容。
下面一段代碼定義了一個名為generate_new_list_with的函數。該函數的本意是在每次調用時都新建一個包含有給定element值的list。而實際運行結果如下:

{% highlight python %}
{% raw %}
Python 2.7.9 (default, Dec 19 2014, 06:05:48)
[GCC 4.2.1 Compatible Apple LLVM 6.0 (clang-600.0.56)] on darwin
Type "help", "copyright", "credits" or "license" for more information.

def generate_new_list_with(my_list=[], element=None):
... my_list.append(element)
... return my_list
...

list_1 = generate_new_list_with(element=1)
list_1
[1]

list_2 = generate_new_list_with(element=2)
list_2
[1, 2]

{% endraw %}
{% endhighlight %}

可見代碼運行結果並不和我們預期的一樣。list_2在函數的第二次調用時並沒有得到一個新的list並填入2,而是在第一次調用結果的基礎上append了一個2。為什么會發生這樣在其他編程語言中簡直就是設計bug一樣的問題呢?

准備知識:Python變量的實質

要了解這個問題的原因我們先需要一個准備知識,那就是:Python變量到底是如何實現的?
Python變量區別於其他編程語言的申明&賦值方式,采用的是創建&指向的類似於指針的方式實現的。即Python中的變量實際上是對值或者對象的一個指針(簡單的說他們是值得一個名字)。我們來看一個例子。
{% highlight python %}
{% raw %}
p = 1
p = p+1
{% endraw %}
{% endhighlight %}
對於傳統語言,上面這段代碼的執行方式將會是,先在內存中申明一個p的變量,然后將1存入變量p所在內存。執行加法操作的時候得到2的結果,將2這個數值再次存入到p所在內存地址中。可見整個執行過程中,變化的是變量p所在內存地址上的值
上面這段代碼中,Python實際上是現在執行內存中創建了一個1的對象,並將p指向了它。在執行加法操作的時候,實際上通過加法操作得到了一個2的新對象,並將p指向這個新的對象。可見整個執行過程中,變化的是p指向的內存地址


函數參數默認值陷阱的根本原因

一句話來解釋:Python函數的參數默認值,是在編譯階段就綁定的。

現在,我們先從一段摘錄來詳細分析這個陷阱的原因。下面是一段從Python Common Gotchas中摘錄的原因解釋:

Python’s default arguments are evaluated once when the function is defined, not each time the function is called (like it is in say, Ruby). This means that if you use a mutable default argument and mutate it, you will and have mutated that object for all future calls to the function as well.

可見如果參數默認值是在函數編譯compile階段就已經被確定。之后所有的函數調用時,如果參數不顯示的給予賦值,那么所謂的參數默認值不過是一個指向那個在compile階段就已經存在的對象的指針。如果調用函數時,沒有顯示指定傳入參數值得話。那么所有這種情況下的該參數都會作為編譯時創建的那個對象的一種別名存在。如果參數的默認值是一個不可變(Imuttable)數值,那么在函數體內如果修改了該參數,那么參數就會重新指向另一個新的不可變值。而如果參數默認值是和本文最開始的舉例一樣,是一個可變對象(Muttable),那么情況就比較糟糕了。所有函數體內對於該參數的修改,實際上都是對compile階段就已經確定的那個對象的修改。
對於這么一個陷阱在 Python官方文檔中也有特別提示:

Important warning: The default value is evaluated only once. This makes a difference when the default is a mutable object such as a list, dictionary, or instances of most classes. For example, the following function accumulates the arguments passed to it on subsequent calls:


如何避免這個陷阱帶來不必要麻煩

當然最好的方式是不要使用可變對象作為函數默認值。如果非要這么用的話,下面是一種解決方案。還是以文章開頭的需求為例:
{% highlight python %}
{% raw %}
def generate_new_list_with(my_list=None, element=None):
if my_list is None:
my_list = []
my_list.append(element)
return my_list
{% endraw %}
{% endhighlight %}


為什么Python要這么設計

這個問題的答案在 StackOverflow 上可以找到答案。這里將得票數最多的答案最重要的部分摘錄如下:

Actually, this is not a design flaw, and it is not because of internals, or performance.
It comes simply from the fact that functions in Python are first-class objects, and not only a piece of code.
As soon as you get to think into this way, then it completely makes sense: a function is an object being evaluated on its definition; default parameters are kind of "member data" and therefore their state may change from one call to the other - exactly as in any other object.
In any case, Effbot has a very nice explanation of the reasons for this behavior in Default Parameter Values in Python.
I found it very clear, and I really suggest reading it for a better knowledge of how function objects work.

在這個回答中,答題者認為出於Python編譯器的實現方式考慮,函數是一個內部一級對象。而參數默認值是這個對象的屬性。在其他任何語言中,對象屬性都是在對象創建時做綁定的。因此,函數參數默認值在編譯時綁定也就不足為奇了。
然而,也有其他很多一些回答者不買賬,認為即使是first-class object也可以使用closure的方式在執行時綁定。

This is not a design flaw. It is a design decision; perhaps a bad one, but not an accident. The state thing is just like any other closure: a closure is not a function, and a function with mutable default argument is not a function.

甚至還有反駁者拋開實現邏輯,單純從設計角度認為:只要是違背程序猿基本思考邏輯的行為,都是設計缺陷!下面是他們的一些論調:

Sorry, but anything considered "The biggest WTF in Python" is most definitely a design flaw. This is a source of bugs for everyone at some point, because no one expects that behavior at first - which means it should not have been designed that way to begin with.

The phrases "this is not generally what was intended" and "a way around this is" smell like they're documenting a design flaw.

好吧,這么看來,如果沒有來自於Python作者的親自陳清,這個問題的答案就一直會是一個謎了。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM