理解Python中的__builtin__和__builtins__


1.名稱空間(Namespace)

 

        首先不得不說名稱空間,因為名稱空間是Python中非常重要的一個概念,所謂名稱空間,其實指的是名稱(標識符)到對象的映射。

        在一個正常的Python程序的執行過程中,至少存在兩個名稱空間:

  • 內建名稱空間

  • 全局名稱空間

        如果定義了函數,則還會有局部名稱空間,全局名稱空間一般由在程序的全局變量和它們對應的映射對象組成,而局部名稱空間則在函數內部由函數局部變量和它們對應的映射對象組成,這里關鍵的是內建名稱空間,它到底是怎么產生的?

 


 

2.內建函數

 

        在啟動Python解釋器之后,即使沒有創建任何的變量或者函數,還是會有許多函數可以使用,比如:

1
2
3
4
>>>  abs ( - 1 )
1
>>>  max ( 1 3 )
3

        我們把這些函數稱為內建函數,是因為它們不需要我們程序員作任何定義,在啟動Python解釋器的時候,就已經導入到內存當中供我們使用:

1
2
3
4
5
>>>  abs
<built - in  function  abs >
>>> 
>>>  max
<built - in  function  max >

 


 

3.內建名稱空間與__builtins__

 

        那么內建函數也是函數,雖然我們沒有人為導入這些,但是正如前面所說,在啟動Python解釋器的時候,會自動幫我們導入,那么內建函數存在於哪里呢?

        其實准確地來說,是Python解釋器在啟動的時候會首先加載內建名稱空間,內建名稱空間有許多名字到對象之間映射,而這些名字其實就是內建函數的名稱,對象就是這些內建函數本身(注意區分函數名稱和函數對象的區別)。這些名稱空間由__builtins__模塊中的名字構成:

1
2
>>>  dir ()
[ '__builtins__' '__doc__' '__name__' '__package__' ]

        可以看到有一個__builtins__的模塊名稱,這個模塊本身定義了一個名稱空間,即內建名稱空間,我們不妨dir一下:

1
2
>>>  dir (__builtins__)
[ 'ArithmeticError' 'AssertionError' 'AttributeError' 'BaseException' 'BufferError' 'BytesWarning' 'DeprecationWarning' 'EOFError' 'Ellipsis' 'EnvironmentError' 'Exception' 'False' 'FloatingPointError' 'FutureWarning' 'GeneratorExit' 'IOError' 'ImportError' 'ImportWarning' 'IndentationError' 'IndexError' 'KeyError' 'KeyboardInterrupt' 'LookupError' 'MemoryError' 'NameError' 'None' 'NotImplemented' 'NotImplementedError' 'OSError' 'OverflowError' 'PendingDeprecationWarning' 'ReferenceError' 'RuntimeError' 'RuntimeWarning' 'StandardError' 'StopIteration' 'SyntaxError' 'SyntaxWarning' 'SystemError' 'SystemExit' 'TabError' 'True' 'TypeError' 'UnboundLocalError' 'UnicodeDecodeError' 'UnicodeEncodeError' 'UnicodeError' 'UnicodeTranslateError' 'UnicodeWarning' 'UserWarning' 'ValueError' 'Warning' 'ZeroDivisionError' '_' '__debug__' '__doc__' '__import__' '__name__' '__package__' 'abs' 'all' 'any' 'apply' 'basestring' 'bin' 'bool' 'buffer' 'bytearray' 'bytes' 'callable' 'chr' 'classmethod' 'cmp' 'coerce' 'compile' 'complex' 'copyright' 'credits' 'delattr' 'dict' 'dir' 'divmod' 'enumerate' 'eval' 'execfile' 'exit' 'file' 'filter' 'float' 'format' 'frozenset' 'getattr' 'globals' 'hasattr' 'hash' 'help' 'hex' 'id' 'input' 'int' 'intern' 'isinstance' 'issubclass' 'iter' 'len' 'license' 'list' 'locals' 'long' 'map' 'max' 'memoryview' 'min' 'next' 'object' 'oct' 'open' 'ord' 'pow' 'print' 'property' 'quit' 'range' 'raw_input' 'reduce' 'reload' 'repr' 'reversed' 'round' 'set' 'setattr' 'slice' 'sorted' 'staticmethod' 'str' 'sum' 'super' 'tuple' 'type' 'unichr' 'unicode' 'vars' 'xrange' 'zip' ]

        會看到我們熟悉的內建函數的名稱,如list、dict等,當然還有一些異常和其它屬性。

 


 

4.__builtins__與__builtin__的簡單區別

 

        既然內建名稱空間由__builtins__模塊中的名稱空間定義,那么是不是也意味着內建名稱空間中所對應的這些函數也是在__builtins__模塊中實現的呢?

        顯然不是的,我們可以在解釋器中直接輸入__builtins__:

1
2
>>> __builtins__
<module  '__builtin__'  (built - in )>

        從結果中可以看到,__builtins__其實還是引用了__builtin__模塊而已,這說明真正的模塊是__builtin__,也就是說,前面提到的內建函數其實是在內建模塊__builtin__中定義的,即__builtins__模塊包含內建名稱空間中內建名字的集合(因為它引用或者說指向了__builtin__模塊),而真正的內建函數、異常和屬性來自__builtin__模塊。也就是說,在Python中,其實真正是只有__builtin__這個模塊,並不存在__builtins__這個模塊:

1
2
3
4
5
>>>  import  __builtin__
>>>  import  __builtins__
Traceback (most recent call last):
   File  "<stdin>" , line  1 in  <module>
ImportError: No module named __builtins__

        可以看到,導入__builtin__模塊並沒有問題,但導入__builtins__模塊時就會提示不存在,這充分說明了前面的結論,現在再次總結如下:

  • 在Python中並沒有__builtins__這個模塊,只有__builtin__模塊,__builtins__模塊只是在啟動Python解釋器時,解釋器為我們自動創建的一個到__builtin__模塊的引用

        當然,至於這種引用到底是怎么樣,可以看下面的深入區別。

 


 

5.__builtins__與__builtin__的深入區別

 

        上面只是大概說了下__builtins__與__builtin__兩個模塊的簡單區分而已,其實深究下去,要分成下面所提及的兩種情況。

 

(1)在主模塊__main__中

        其實我們在使用Python交互器的時候就是在主模塊中進行操作,可以做如下驗證:

1
2
>>>  print  __name__
__main__

        在這種情況,__builtins__與__builtin__是完全一樣的,它們指向的都是__builtin__這個內建模塊:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
>>>  import  __builtin__
>>> __builtin__
<module  '__builtin__'  (built - in )>
>>> __builtins__
<module  '__builtin__'  (built - in )>
>>> __builtin__.__name__
'__builtin__'
>>> __builtins__.__name__
'__builtin__'
>>> __builtins__  = =  __builtin__
True
>>> __builtins__  is  __builtin__
True
>>>  id (__builtins__)
140295127423752
>>>  id (__builtin__)
140295127423752

        可以看到,這時候__builtins__和__builtin__是完全一樣的,它們都指向了同一個模塊對象,其實這也是Python中引用傳遞的概念。

        其實這種情況跟我們創建一個變量並對它做一次引用傳遞時的情況是一樣的,可以做如下測試:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
>>>  def  func():
...      print  'test'
... 
>>> func
<function func at  0x7f99012bdc08 >
>>> funcs
<function func at  0x7f99012bdc08 >
>>> func.__name__
'func'
>>> funcs.__name__
'func'
>>> funcs  = =  func
True
>>> funcs  is  func
True
>>>  id (funcs)
140295126375432
>>>  id (func)
140295126375432

        顯然,這完全驗證了我們上面的結論。

 

(2)不是在主模塊中

        如果不是在主模塊中使用__builtins__,這時候,__builtins__只是對__builtin__.__dict__的一個簡單引用而已,可以通過下面的測試來驗證說明。

        先創建一個test.py模塊,后面我們需要在Python交互器中導入它,那么這時候對於test模塊來說,它就不是主模塊了。如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
#!/usr/bin/env python
 
import  __builtin__
 
 
print  'Module name:' , __name__
 
 
print  '*==test __builtin__ and __builtins__==*'
print  '__builtin__ == __builtins__' , __builtin__  = =  __builtins__
print  '__builtin__ is __builtins__' , __builtin__  is  __builtins__
print  'id(__builtin__)' id (__builtin__)
print  'id(__builtins__)' id (__builtins__)
 
print  '=' * 50
 
print  '*==test __builtin__.__dict__ and __builtins__==*'
print  '__builtin__.__dict__ == __builtins__' , __builtin__.__dict__  = =  __builtins__
print  '__builtin__ is __builtins__' , __builtin__.__dict__  is  __builtins__
print  'id(__builtin__)' id (__builtin__.__dict__)
print  'id(__builtins__)' id (__builtins__)

        在Python交互器中導入上面這個test模塊,如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
>>>  import  test
Module name: test
* = = test __builtin__  and  __builtins__ = = *
__builtin__  = =  __builtins__  False
__builtin__  is  __builtins__  False
id (__builtin__)  140592847690504
id (__builtins__)  140592847925608
= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =
* = = test __builtin__.__dict__  and  __builtins__ = = *
__builtin__.__dict__  = =  __builtins__  True
__builtin__  is  __builtins__  True
id (__builtin__)  140592847925608
id (__builtins__)  140592847925608

        可以看到輸出的結果跟我們想的是完全一樣的,即這時候__builtins__其實是對__builtin__.__dict__模塊的引用。

 


 

6.總結

 

        不管怎么說,在啟動Python解釋器或運行一個Python程序時,內建名稱空間都是從__builtins__模塊中加載的,只是__builtins__本身是對Python內建模塊__builtin__的引用,而這種引用又分下面兩種情況:

  • 如果是在主模塊__main__中,__builtins__直接引用__builtin__模塊,此時模塊名__builtins__與模塊名__builtin__指向的都是同一個模塊,即<builtin>內建模塊(這里要注意變量名和對象本身的區別)

  • 如果不是在主模塊中,那么__builtins__只是引用了__builtin__.__dict__

        如果需要轉載本文,請注明來自香飄葉子的51cto博客

        在寫本文的時候,參考了下面的文章,只是這些文章並沒有給出像上面我這樣的測試,鏈接如下:

https://docs.python.org/2/library/__builtin__.html?highlight=_builtin__#module-__builtin__

http://www.52ij.com/jishu/665.html


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM